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Go 语言 起 源 
Go 语言 项 目 
本 书 的 组 织 
更 多 的 信息 


致谢 
AJ] 


Hello, World 
命令 行 参数 


查找 重复 的 行 


GIF 动画 


获取 URL 
并 发 获取 多 个 URL 
Web 服 务 


本 章 要 点 
程序 结构 


包 和 文件 


作用 域 
基础 数据 类 型 


整 型 


目录 


复合 数据 类 型 


数组 

Slice 

Map 

结构 体 

JSON 

文本 和 HTML 模 板 


函数 声明 
递归 

多 返回 值 

BIR 

函数 值 

BZ BR 
可 变 参 数 
Deferred % 4 
Panic 异 常 
Recover 捕 获 异 常 


Wy tk 


方法 声明 


基于 指针 对 象 的 方法 
通过 瞬 入 结构 体 来 扩展 类 
方法 值 和 方法 表达 式 


示例 : Bit 数 组 
封装 


接口 


接口 是 合约 
接口 类 型 
实现 接口 的 条 件 
flag.Value 接 口 
接口 值 
sort.Interface 接 口 
http.Handler 接 口 


error 接 口 


型 断言 识别 错误 类 型 


型 断言 查询 接口 


示例 : 基于 标记 的 XML 解码 
补充 几 点 
Goroutines 和 Channels 
Goroutines 
示例 : 并 发 的 Clock 服 务 
示例 : 并 发 的 Echo 服务 
Channels 
并 发 的 循环 
示例 : FF RK AWeb Ie R 
基于 select 的 多 路 复 用 
示例 : 并 发 的 字典 
并 发 的 退出 
示例 : 聊天 服务 
基于 共享 变量 的 并 发 
竞争 条 件 
sync.Mutex 互 斤 锁 
sync.RWMutex 读 写 锁 
内 存 同 步 
sync.Once 初 始 化 
竞争 条 件 检测 
示例 : 并 发 的 非 阻塞 缓存 
Goroutines 和 线程 
包 和 工具 
包 简 介 
导入 路 径 
包 声 明 
导入 声明 
包 的 匿名 导入 


go test 
测试 函数 
测试 覆盖 率 
基准 测试 
剖析 

示例 函数 


反射 


为 何 需要 反射 ? 
reflect.Type 和 reflect.Value 
Display x )2 4r FP 

示例 : 编码 S 表 达 式 

通过 reflect.Value 修 改 值 
示例 : 解码 S 表 达 式 
获取 结构 体 字 段 标识 
显示 一 个 类 型 的 方法 集 


几 点 忠告 =] 


底层 编程 


unsafe.Sizeof, Alignof 和 Offsetof 
unsafe.Pointer 

示例 : 深度 相等 判断 

通过 cgo 调 用 C 代 码 

几 点 中 


oe 


附录 


附录 A : 原文 勘误 
附录 B : 作者 译 者 
附录 C : 译文 授权 
附录 D : 其 它 语言 


Go 语言 圣经 


Go 语言 圣经 (中 文 版 ) 


Go 语言 圣经 《The Go Programming Language) 中 文 版 本 ， 仅 供 学 习 交 流 之 用 。 





Go 语言 圣经 ( 中 文 版 ) 


The Go Programming Language 


Alan A. A. Donovan , Brian W. Kernighan ( 著 ) 
chai2010 , Xargin , CrazySssst , foreversmart ( ij ) 
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e 项 目 主页 : http://github.com/golang-china/gopl-zh 
e 项 目 主 页 : http://bitbucket.org/golang-china/gopl-zh 
e 原版 官网 : http://gopl.io 


在 线 预览 : 


http://docs.ruanjiadeng.com/gopl-zh/ 


http://shifei.me/gopl-zh/ 


http://2goo.info/media/html/gopl-zh-gh-pages/ 


http://docs.plhwin.com/gopl-zh/ 


版 本 信息 


e 仓库 版 本 : master 


o 构建 时 间 : 2016-03-30 


FAF 


在 上 个 世纪 70 年 代 ， 贝 尔 实 验 室 的 和 合作 发 明了 操作 
系统 ， 同 时 ihe 系统 的 移植 性 问题 而 发 明了 C 语 言 ， 贝 尔 实验 室 
的 和 CC 语言 两 大 发 明黄 整个 现代 IT 行业 最 重要 的 软件 基础 〈 目 前 的 三 大 桌面 操作 系 
统 的 中 和 ee 系统 ， 两 大 移动 平台 的 操作 系统 iDS 和 Android 也 都 是 
源 于 系统 。C 系 家 族 的 编程 语言 占据 统治 地 位 达 几 十 年 之 久 ) 。 在 和 C 语 言 发 明 40 
年 之 后 ， 目 前 已 经 在 Google 工 作 的 和 (他 们 在 贝尔 实验 室 时 就 是 同 
事 ) 、 还 有 (设计 了 V8 引擎 和 HotSpot 虚 拟 机 ) 一 起 合作 ， 为 了 解决 在 21 世 


纪 多 核 和 网 络 化 环境 下 越 来 越 复 杂 的 编程 问题 而 发 明了 Go 语言 。 从 Go 语言 库 早期 代码 库 日 志 
可 以 看 出 它 的 演化 历程 (Git A git log --before={2008-03-03} --reverse 多 命令 查看 ) 


:\go\go-tip>hg log -r 0:4 

hangeset: 0:f6182e5abf5e 
Brian Kernighan <bwk> 
Tue Jul 18 19:05:45 1972 -0500 
hello, world 


1:b66d0bf8da3e 
Brian Kernighan <bwk> 
Sun Jan 20 01:02:03 1974 -0400 


Convert to C 


2:ac3363d/e/788 

Brian Kernighan <research! bwk> 
Fri Apr 01 02:02:04 1988 -0500 
convert to Draft-Proposed ANSI C 


3:172d32922e72 
Brian Kernighan <bwk@research.att.com> 
Fri Apr 01 02:03:04 1988 -0500 

ummary: last-minute fix: convert to ANSI C 


hangeset: 4:4e9a5b095532 
pE Robert Griesemer <gri@golang.org> 
Sun Mar 02 20:47:34 2008 -0800 
summary: Go spec starting point. 


C:\go\go-tip> 





从 早期 提交 日 志 中 也 可 以 看 出 ，Go 语 言 是 从 发 明 的 B 语 言 、 
发 明 的 C 语 言 逐 步 演化 过 来 的 ， 是 C 语 言 家 族 的 成 员 ， 因 此 很 多 人 将 Go 语言 称 为 21 世 纪 的 C 语 
言 。 纵 观 这 几 年 来 的 发 展 趋势 ，Go 语 言 已 经 成 为 云 计算 、 云 存储 时 代 最 重要 的 基础 编程 语 


在 Ci 语言 发 明之 后 约 5 年 的 时 间 之 后 (1978 年 ) > 和 a 
编写 出 版 了 C 语 言 方面 的 经 典 教材 《 》， 该 书 被 誉 为 C 语 言 


序 员 的 圣经 ， 作 者 也 被 大 家 亲切 地 称 为 。 同样 在 Go 语言 正式 发 布 (2009 年 ) ain 


(2014 年 开始 写作 ，2015 年 出 版 ) ， 由 Go 语言 核心 团队 成 员 Alan A. A. Donovan 和 K&R 中 的 
Brian W. Kernighan 合 作 编 写 了 Go 语言 方面 的 经 典 教材 《The Go Programming 
Language》。Go 语 言 被 堂 为 21 世 纪 的 C 语 言 ， 如 果 说 K&R 所 著 的 是 圣经 的 上 加 约 ， 那 么 D&K 所 
著 的 必 将 成 为 圣经 的 新 约 。 该 书 介绍 了 Go 语言 几乎 全 部 特性 ， 并 且 随 着 语言 的 深入 层 层 递 
进 ， 对 每 个 细节 都 解读 得 非常 细致 ， 每 一 节 内 容 都 精彩 不 容错 过 ， 是 广大 Gopher 的 必 读 书 
目 。 大 部 分 Go 语言 核心 团队 的 成 员 都 参与 了 该 书 校对 工作 ， 因 此 该 书 的 质量 是 可 以 完全 放心 
的 。 


同时 ， 单 赁 阅读 和 学 习 其 语法 结构 并 不 能 站 正 地 掌握 一 门 编程 语言 ， 必 须 进 行 足够 多 的 编程 
实践 一 一 亲自 编写 一 些 程序 并 研究 学 习 别 人 写 的 程序 。 要 从 利用 Go 语言 良好 的 特性 使 得 程序 
模块 化 ， 充 分 利用 Go 的 标准 函数 库 以 Go 语言 自己 的 风格 来 编写 程序 。 书 中 包含 了 上 百 个 精心 
挑选 的 习题 ， 和 希望 大 家 能 先 用 自己 的 方式 尝试 完成 习题 ， 然 后 再 参考 官方 给 出 的 解决 方案 。 


该 书 英文 版 约 从 2015 年 10 月 开始 公开 发 售 ， 其 中 日 文 版 本 最 早 参与 翻译 和 审 校 (参考 致谢 部 
T) 。 在 2015 年 10 月 ， 我 们 并 不 知道 中 文 版 是 否 会 及 时 引进 、 将 由 哪 家 出 版 社 引 进 、 引 进 将 
由 何人 来 翻译 、 何 时 能 出 版 ， 这 些 信息 都 成 了 一 个 秘密 。 中 国 的 Go 语言 社区 是 全 球 最 大 的 Go 
语言 社区 ， 我 们 从 一 开始 就 始终 紧 跟 着 Go 语言 的 发 展 脚步 。 我 们 应 该 也 完全 有 能 力 以 中 国 Go 
语言 社区 的 力量 同步 完成 Go 语言 圣经 中 文 版 的 翻译 工作 。 与 此 同时 ， 国 内 有 很 多 Go 语言 爱好 
者 也 在 积极 关注 该 书 〈 本 人 也 在 第 一 时 间 购 买 了 纸 质 版 本 ， 亚 马 示 价格 314 人 民 币 。 补 充 : 国 
内 也 即将 出 版 英文 版 ， 价 格 79 元 ) 。 为 了 Go 语言 的 学 习 和 交流 ， 大 家 决定 合作 免费 翻译 该 

书 o 

翻译 工作 从 2015 年 11 月 20 日 前 后 开始 ， 到 2016 年 1 月 底 初 步 完成 ， 前 后 历时 约 2 个 月 时 间 (在 
其 它 语言 版 本 中 ， 全 球 第 一 个 完成 翻译 的 ， 基 本 做 到 和 原版 同步 ) 。 其 中 ，chai2010 翻 译 了 

前 言 、 第 2~4 章 、 第 10~13 章 ，Xargin 翻 译 了 第 1 章 、 第 6 章 、 第 8~9 章 ，CrazySssst 翻 译 了 第 5 
章 ，foreversmart 翻 译 了 第 7 章 ， 大 家 共同 参与 了 基本 的 校 验 工 作 ， 还 有 其 他 一 些 朋 友 提 供 了 
要 极 的 反馈 建议 。 如 果 大 家 还 有 任何 问题 或 建议 ， 可 以 直接 到 中 文 版 项 目 页 面 提交 |ssue， 如 
果 发 现 英文 版 原文 在 勘误 中 未 提 到 的 任何 错误 ， 可 以 直接 去 英文 版 项 目 提 交 。 


最 后 ， 和 希望 这 本 书 能 够 帮助 大 家 用 Go 语言 快乐 地 编程 。 


2016 年 1 月 于 武汉 


“Go 是 一 个 开源 的 编程 语言 ， 它 很 容易 用 于 构建 简单 、 可 靠 和 高 效 的 软件 。”( 摘 自 Go 语 言 官 
方 网 站 : http://golang.org ) 
Go 语言 由 来 自 Google 公 司 的 Robert Griesemer，Rob Pike 和 Ken Thompson 三 位 大 牛 于 2007 


年 9 月 开始 设计 和 实现 ， 然 后 于 2009 年 的 11 月 对 外 正式 发 布 (译注 : 关于 Go 语言 的 创世纪 过 
程 请 参考 http://talks.golang.org/2015/how-go-was-made.slide ) 。 语 言及 其 配套 工具 的 设计 


目标 是 具有 表达 力 ， 高 效 的 编译 和 执行 效率 ， 有 效 地 编写 高 效 和 健壮 的 程序 。 


Go 语言 有 着 和 C 语 言 类 似 的 语法 外 表 ， 和 C 语 言 一 样 是 专业 程序 员 的 必 备 工具 ， 可 以 用 最 小 的 
代价 获得 最 大 的 战果 。 但 是 它 不 仅仅 是 一 个 更 新 的 C 语 言 。 它 还 从 其 他 语言 借鉴 了 很 多 好 的 
想法 ， 同 时 避免 引入 过 度 的 复杂 性 。 Go 语言 中 和 并 发 编程 相关 的 特性 是 全 新 的 也 是 有 效 的 ， 
同时 对 数据 抽象 和 面向 对 象 编 程 的 支持 也 很 灵活 。 Go 语言 同时 还 集成 了 自动 垃圾 收集 技术 用 
于 更 好 地 管理 内 存 。 


` 


Go 语言 尤其 适合 编写 网 络 服务 相关 基础 设施 ， 同 时 也 适合 开发 一 些 工具 软件 和 系统 软件 。 但 
是 Go 语言 确实 是 一 个 通用 的 编程 语言 ， 它 也 可 以 用 在 图 形 图 像 驱动 编程 、 移 动 应 用 程序 开发 
和 机 器 学 习 等 诸多 领域 。 目 前 Go 语言 已 经 成 为 受 欢迎 的 作为 无 类 型 的 脚本 语言 的 蔡 代 者 : 
为 Go 编写 的 程序 通常 比 脚本 语言 运行 的 更 快 也 更 安全 ， 而 且 很 少 会 发 生意 外 的 类 型 错误 。 


Go 语言 还 是 一 个 开源 的 项 目 ， 可 以 免费 获 编译 器 、 库 、 配 套 工具 的 源 代 码 。 Go 语言 的 贡献 
者 来 自 一 个 活跃 的 全 球 社区 。Go 语 言 可 以 运行 在 类 UNIX 系 统 比如 

Linux ` FreeBSD ` OpenBSD ` Mac OSX- 和 Plan9 系 统 和 Microsoft Windows 操 作 系 统 之 
Le Go 语言 编写 的 程序 无 需 修 改 就 可 以 运行 在 上 面 这 些 环境 。 








本 书 是 为 了 帮助 你 开始 以 有 效 的 方式 使 用 Go 语言 ， 充 分 利用 语言 本 身 的 特性 和 自 带 的 标准 库 
去 编写 清晰 地 道 的 Go 程序 。 


\\ 


Go 语言 起 源 


编程 语言 的 演化 就 像 生 物 物种 的 演化 类 似 ， 一 个 成 功 的 编程 语言 的 后 代 一 般 都 会 继承 它们 祖 
先 的 优点 ; 当然 有 时 多 种 语言 杂 合 也 可 能 会 产生 令 人 惊讶 的 特性 ; 还 有 一 些 激进 的 新 特性 可 
能 并 没有 先例 。 我 们 可 以 通过 观察 编程 语言 和 软 硬 件 环境 是 如 何 相 互 促进 、 相 互 影响 的 演化 
过 程 而 学 到 很 多 。 


下 图 展示 了 有 哪些 早期 的 编程 语言 对 Go 语言 的 设计 产生 了 重要 影响 。 


ALGOL 60 
(Backus et al., 1960) 


| 


Pascal 
(Wirth, 1970) 
¢ 
| (Ritchie, 1972) 
CSP 
(Hoare, 1978) Modula-2 
| (Wirth, 1980) 
Squeak 
(Cardelli & Pike, 1985) Oberon 
4 (Wirth & Gutknecht, 
1986) 
page ag Object Oberon 
| (Méssenbéck, Templ 
& Griesemer, 1990) 
Alef Oberon-2 
(Winterbottom, 1992) (Wirth —e 





Go 
(Griesemer, Pike & Thompson, 2009) 


Go 语言 有 时 候 被 描述 为 "C 类 似 语言 "， 或 者 是 "21 世纪 的 C 语 言 "。Go 从 C 语 言 继承 了 相似 的 表 
达 式 语法 、 控 制 流 结构 、 基 础 数据 类 型 、 调 用 参数 传 值 、 指 针 等 很 多 思想 ， 还 有 C 语 言 一 直 所 
看 中 的 编译 后 机 器 码 的 运行 效率 以 及 和 现 有 操作 系统 的 无 缝 适 配 。 


但 是 在 Go 语言 的 家 族 树 中 还 有 其 它 的 祖先 。 其 中 一 个 有 影响 力 的 分 支 来 自 Niklaus Wirth 所 设 
计 的 Pascal 语 言 。 然 后 Modula-2 语 言 激发 了 包 的 概念 。 然 后 Oberon 语 言 握 弃 了 模块 接口 文件 
和 模块 实现 文件 之 间 的 区 别 。 第 二 代 的 Oberon-2 语 言 直 接 影响 了 和 包 的 导入 和 声明 的 语法 ， 还 


有 Oberon 语 言 的 面向 对 锣 特 性 所 提供 的 方法 的 声明 语法 等 。 


Go 语言 的 另 一 支 祖先 ， 带 来 了 Go 语言 区 别 其 他 语言 的 重要 特性 ， 灵 感 来 自 于 贝尔 实验 室 的 
Tony Hoare 于 1978 年 发 表 的 鲜 为 外 界 所 知 的 关于 并 发 研究 的 基础 文献 顺序 通信 进程 ( 
communicating sequential processes， 缩 写 为 CSP。 在 CSP 中 ， 程 序 是 一 组 中 间 没 有 共享 状 
态 的 平行 运行 的 处 理 过 程 ， 它 们 之 间 使 用 管道 进行 通信 和 控制 同步 。 不 过 Tony Hoare 的 CSP 
只 是 一 个 用 于 描述 并 发 性 基本 概念 的 描述 语言 ， 并 不 是 一 个 可 以 编写 可 执行 程序 的 通用 编程 


TES 


IT Š > Rob Pike 和 其 他 人 开始 不 断 尝试 将 CSP 引 入 实际 的 编程 语言 中 。 他 们 第 一 次 尝试 引 
入 CSP 特 性 的 编程 语言 叫 Squeak (老鼠 间 交 流 的 语言 ) ， 是 一 个 提供 鼠标 和 键盘 事件 处 理 的 
编程 语言 ， 它 的 管道 是 静态 创建 的 。 然 后 是 改进 版 的 Newsqueak 语 言 ， 提 供 了 类 似 C 语 言语 
名 和 表达 式 的 语法 和 类 似 Pascal 语 言 的 推导 语法 。Newsqueak 是 一 个 带 垃圾 回收 的 纯 函 数 式 
语言 ， 它 再 次 针对 键盘 、 和 鼠标 和 窗口 事件 管理 。 但 是 在 Newsqueak 语 言 中 管道 是 动态 创建 
的 ， 属 于 第 一 类 值 , 可 以 保存 到 变量 中 。 


在 Plan9 操 作 系 统 中 ， 这 些 优 秀 的 想法 被 吸收 到 了 一 个 叫 Alef 的 编程 语言 中 。Alef 试 图 将 
Newsqueak 语 言 改 造 为 系统 编程 语言 ， 但 是 因为 缺少 垃圾 回收 机 制 而 导致 并 发 编程 很 痛苦 。 

(译注 : 在 Aelf 之 后 还 有 一 个 叫 Limbo 的 编程 语言 ，Go 语 言 从 其 中 借鉴 了 很 多 特性 。 具体 请 
参考 Pike 的 讲稿 : http://talks.golang.org/2012/concurrency.slide#9 ) 


Go 语言 的 其 他 的 一 些 特性 零散 地 来 自 于 其 他 一 些 编程 语言 ; 比如 iota 语 法 是 从 APL 语 言 借鉴 ， 
词法 作用 域 与 谋 套 函数 来 自 于 Scheme 语 言 (和 其 他 很 多 语言 ) 。 当 然 ， 我 们 也 可 以 从 Go 中 
发 现 很 多 创新 的 设计 。 比 如 Go 语言 的 切片 为 动态 数组 提供 了 有 效 的 随机 存 取 的 性 能 ， 这 可 能 
会 让 人 联想 到 链表 的 底层 的 共享 机 制 。 还 有 Go 语言 新 发 明 的 defer 语 匈 。 


Go 语言 项 目 


所 有 的 编程 语言 都 反映 了 语言 设计 者 对 编程 哲学 的 反思 ， 通 常 包括 之 前 的 语言 所 暴露 的 一 些 
不 足 地 方 的 改进 。Go 项 目 是 在 Google 公 司 维护 超级 复杂 的 几 个 软件 系统 遇 到 的 一 些 问 题 的 反 
思 (但 是 这 类 问题 绝 不 是 Google 公 司 所 特有 的 ) 。 


正如 Rob Pike 所 说 ，" 软 件 的 复杂 性 是 乘法 级 相关 的 "， 通 过 增加 一 个 部 分 的 复杂 性 来 修复 问题 
通常 将 慢 慢 地 增加 其 他 部 分 的 复杂 性 。 通 过 增加 功能 和 选项 和 配置 是 修复 问题 的 最 快 的 途 
径 ， 但 是 这 很 容易 让 人 忘记 简洁 的 内 涵 ， 即 使 从 长 远 来 看 ， 简 洁 依 然 是 好 软件 的 关键 因素 。 


简洁 的 设计 需要 在 工作 开始 的 时 候 舍弃 不 必要 的 想法 ， 并 且 在 软件 的 生命 周期 内 严格 区 别 好 
的 改变 或 坏 的 改变 。 通 过 足够 的 努力 ， 一 个 好 的 改变 可 以 在 不 破坏 原 有 完整 概念 的 前 提 下 保 
持 自 适应 ， 正 如 Fred Brooks 所 说 的 “概念 完整 性 ”; 而 一 个 坏 的 改变 则 不 能 达到 这 个 效果 ， 它 
们 仅仅 是 通过 肤浅 的 和 简单 的 妥协 来 破坏 原 有 设计 的 一 致 性 。 只 有 通过 简洁 的 设计 ， 才 能 让 
一 个 系统 保持 稳定 、 安 全 和 持续 的 进化 。 


Go 项 目 包 括 编程 语言 本 身 ， 附 带 了 相关 的 工具 和 标准 库 ， 最 后 但 并 非 代表 不 重要 的 ， 关 于 简 
洁 编程 哲学 的 宣言 。 就 事后 诸葛 的 角度 来 看 ，Go 语 言 的 这 些 地 方 都 做 的 还 不 错 : 拥有 自动 垃 
圾 回收 、 一 个 包 系 统 、 函 数 作 为 一 等 公民 、 词 法 作用 域 、 系 统 调用 接口 、 只 读 的 UTF8 字 符 串 
等 。 但 是 Go 语言 本 身 只 有 很 少 的 特性 ， 也 不 太 可 能 添加 太 多 的 特性 。 例 如 ， 它 没有 隐 式 的 数 
值 转换 ， 没 有 构造 函数 和 析 构 函数 ， 没 有 运算 符 重 载 ， 没 有 默认 和 参数， 也 没有 继承 ， 没 有 泛 
型 ， 没 有 异常 ， 没 有 宏 ， 没 有 函数 修饰 ， 更 没有 线程 局 部 存储 。 但 是 语言 本 身 是 成 熟 和 稳定 
的 ， 而 且 承 诺 保 证 向 后 兼容 : 用 之 前 的 Go 语言 编写 程序 可 以 用 新 版 本 的 Go 语言 编译 器 和 标准 
库 直 接 构建 而 不 需要 修改 代码 。 


Go 语言 有 足够 的 类 型 系统 以 避免 动态 语言 中 那些 粗心 的 类 型 错误 ， 但 是 Go 语言 的 类 型 系统 相 
比 传统 的 强 类 型 语言 又 要 简洁 很 多 。 虽 然 有 时 候 这 会 导致 一 个 “无 类 型 "的 抽象 类 型 概念 ， 但 是 
Go 语言 程序 员 并 不 需要 像 C++ 或 Haskell 程 序 员 那 样 纠结 于 具体 类 型 的 安全 属性 。 在 实践 中 Go 
语言 简洁 的 类 型 系统 给 了 程序 员 带 来 了 更 多 的 安全 性 和 更 好 的 运行 时 性 能 。 


Go 语言 鼓励 当代 计算 机 系统 设计 的 原则 ， 特 别 是 局 部 的 重要 性 。 它 的 内 置 数据 类 型 和 大 多 数 
的 准 库 数据 结构 都 经 过 精心 设计 而 避免 显 式 的 初始 化 或 隐 式 的 构造 函数 ， 因 为 很 少 的 内 存 分 
配 和 内 存 初始 化 代码 被 隐藏 在 库 代码 中 了 。Go 语 言 的 聚合 类 型 (结构 体 和 数组 ) 可 以 直接 操 
作 它 们 的 元 素 ， 只 需要 更 少 的 存储 空间 、 更 少 的 内 存 分 配 ， 而 且 指 针 操 作 比 其 他 间接 操作 的 
语言 也 更 有 效率 。 由 于 现代 计算 机 是 一 个 并 行 的 机 器 ，Go 语 言 提供 了 基于 CSP 的 并 发 特性 支 
持 。Go 语 言 的 动态 栈 使 得 轻 量 级 线程 goroutine 的 初始 栈 可 以 很 小 ， 因 此 创建 一 个 goroutine 的 
代价 很 小 ， 创 建 百 万 级 的 goroutine 完 全 是 可 行 的 。 


Go 语言 的 标准 库 (通常 被 称 为 语言 自 带 的 电池 ) ， 提 供 了 清晰 的 构建 模块 和 公共 接口 ， 包 含 
/OO 操作、 文本 处 理 、 图 像 、 密 码 学 、 网 络 和 分 布 式 应 用 程序 等 ， 并 支持 许多 标准 化 的 文件 格 
式 和 编 解码 协议 。 库 和 工具 使 用 了 大 量 的 约定 来 减少 额外 的 配置 和 解释 ， 从 而 最 终 简 化 程序 


的 逻辑 ， 而 且 每 个 Go 程序 结构 都 是 如 此 的 相似 ， 因 此 Go 程序 也 很 容易 学 习 。 使 用 Go 语言 自 
带 工具 构建 Go 语言 项 目 只 需要 使 用 文件 名 和 标识 符 名 称 , 一 个 偶尔 的 特殊 注释 来 确定 所 有 的 


库 、 可 执行 文件 、 测 试 、 基 准 测试 、 例 子 、 以 及 特定 于 平台 的 变量 、 项 目的 文档 等 ; Go 语言 
源 代码 本 身 就 包含 了 构建 规范 。 


本 书 的 组 织 


我 们 假设 你 已 经 有 一 种 或 多 种 其 他 编程 语言 的 使 用 经 历 ， 不 管 是 类 似 C、c++ 或 Java 的 编译 型 
语言 ， 还 是 类 似 Python、Ruby、JavaScript 的 脚本 语言 ， 因 此 我 们 不 会 像 对 完全 的 编程 语言 
初学 者 那样 解释 所 有 的 细节 。 因 为 Go 语言 的 变量 、 常 量 、 表 达 式 、 控 制 流 和 有 函数 等 基本 语法 
也 是 类 似 的 。 


第 一 章 包含 了 本 教程 的 基本 结构 ， 通 过 十 几 个 程序 介绍 了 用 Go 语言 如 何 实现 类 似 读 写 文件 、 
文本 格式 化 、 创 建 图 像 、 网 络 客户 端 和 服务 器 通讯 等 日 常 工 作 。 


BY 


第 述 了 Go 语言 程序 的 基本 元 素 结构 、 变 量 、 新 类 型 定义 、 包 和 文件 、 以 及 作用 域 的 概 
念 。 第 三 章 讨论 了 数字 、 布 尔 值 、 字 符 串 和 常量 ， 并 演示 了 如 何 显示 和 处 理 Unicode 字 符 。 第 
描述 了 复合 类 型 ， 从 简单 的 数组 、 字 典 、 切 片 到 动态 列表 。 第 五 章 涵盖 了 函数 ， 并 讨论 
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第 一 章 到 第 五 章 是 基础 部 分 ， 主 流 命令 式 编程 语言 这 部 分 都 类 似 。 个 别 之 处 ，Go 语 言 有 自己 
特色 的 语法 和 风格 ， 但 是 大 多 数 程序 员 能 很 快 适 应 。 其 余 章 节 是 Go 语言 特有 的 : 方法 、 接 
口 、 并 发 、 包 、 测 试 和 反射 等 语言 特性 。 


Go 语言 的 面向 对 象 机 制 与 一 般 语言 不 同 。 它 没有 类 层次 结构 ， 其 至 可 以 说 没有 类 ; 仅仅 通过 
组 合 (而 不 是 继承 ) 简单 的 对 象 来 构建 复杂 的 对 象 。 方 法 不 仅 可 以 定义 在 结构 体 上 , 而 且 可 以 
定义 在 任何 用 户 自 定义 的 类 型 上 ; 并 且 具 体 类 型 和 抽象 类 型 (接口 ) 之 间 的 关系 是 隐 式 的 ， 
所 以 很 多 类 型 的 设计 者 可 能 并 不 知道 该 类 型 到 底 实现 了 哪些 接口 。 方 法 在 第 六 章 讨 论 ， 接 口 
在 第 七 章 讨论 。 


第 八 章 讨论 了 基于 顺序 通信 进程 (CSP) 概 念 的 并 发 编程 ， 使 用 goroutines 和 channels 处 理 并 发 
编程 。 第 九 章 则 讨论 了 传统 的 基于 共享 变量 的 并 发 编程 。 


第 十 章 描述 了 包机 制 和 包 的 组 织 结构 。 这 一 章 还 展示 了 如 何 有 效 的 利用 Go 自 带 的 工具 ， 使 用 
单个 命令 完成 编译 、 测 试 、 基 准 测 试 、 代 码 格式 化 、 文 档 以 及 其 他 诸多 任务 。 


第 十 一 章 讨论 了 单元 测试 ，Go 语 言 的 工具 和 标准 库 中 集成 了 轻 量 级 的 测试 功能 ， 避 免 了 强大 
但 复杂 的 测试 框架 。 测 试 库 提供 了 一 些 基 本 构件 ， 必 要 时 可 以 用 来 构建 复杂 的 测试 构件 。 


第 十 二 章 讨 论 了 反射 ， 一 种 程序 在 运行 期 间 审 视 自 己 的 能 力 。 反 射 是 一 个 强大 的 编程 工具 ， 
不 过 要 说 懂 地 使 用 ; 这 一 章 利 用 反射 机 制 实现 一 些 重要 的 Go 语言 库 函 数 , 展示 了 反射 的 强大 用 
法 。 第 十 三 章 解 释 了 底层 编程 的 细节 ， 在 必要 时 ， 可 以 使 用 unsafe 包 绕 过 Go 语言 安全 的 类 型 


部 分 章节 的 后 面 有 练习 题 ， 根 据 对 Go 语言 的 理解 修改 书 中 的 例子 来 探索 Go 语言 的 用 法 。 


书 中 所 有 的 代码 都 可 以 从 hittp://gopl.io 上 的 Git 仓 库 下 载 。go get 命 令 根据 每 个 例子 的 导入 路 
径 智 能 地 获取 、 构 建 并 安装 。 只 需要 选择 一 个 目录 作为 工作 空间 ， 然 后 将 GOPATH 环 境 变 量 
设置 为 该 路 径 。 


必要 时 ，Go 语 言 工 具 会 创建 目录 。 例 如 : 


$ export GOPATH=$HOME/gobook # 选择 工作 目录 
$ go get gopl.io/chi/helloworld # 获取 /编译 /安装 
$ $GOPATH/bin/hellowor1d # 运行 程序 
Hello, 世界 # 这 是 中 文 


运行 这 些 例 子 需 要 安装 Go1.5 以 上 的 版 本 。 


$ go version 
go version go1.5 linux/amd64 


如 果 使 用 其 他 的 操作 系统 , 请 参考 https://golang.org/doc/install 提供 的 说 明 安 装 。 


更 多 的 信息 


最 佳 的 帮助 信息 来 自 Go 语 言 的 官方 网 站 ，https://golang.org ， 它 提供 了 完善 的 参考 文档 ， 包 
括 编程 语言 规范 和 标准 库 等 诸多 权威 的 帮助 信息 。 同 时 也 包含 了 如 何 编写 更 地 道 的 Go 程序 的 
基本 教程 ， 还 有 各 种 各 样 的 在 线 文本 资源 和 视频 资源 ， 它 们 是 本 书 最 有 价值 的 补充 。Go 语 言 
的 官方 博客 https://blog.golang.org 会 不 定期 发 布 一 些 Go 语 言 最 好 的 实践 文章 ， 包 括 当 前 语言 
的 发 展 状态 、 未 来 的 计划 、 会 议 报告 和 Go 语言 相关 的 各 种 会 议 的 主题 等 信息 (译注 : 
http://talks.golang.org/ 包含 了 官方 收录 的 各 种 报告 的 讲稿 ) 。 


在 线 访问 的 一 个 有 价值 的 地 方 是 可 以 从 Web 页 面 运行 Go 语言 的 程序 (而 纸 质 书 则 没有 这 么 便 
利 了 ) 。 这 个 功能 由 来 自 https://play.golang.org 的 Go Playground 提供 ， 并 且 可 以 方便 地 髓 
入 到 其 他 页 面 中 ， 例 如 https://golang.org 的 主页 ， 或 godoc 提供 的 文档 页 面 中 。 


Playground 可 以 简单 的 通过 执行 一 个 小 程序 来 测试 对 语法 、 语 义 和 对 程序 库 的 理解 ， 类 似 其 
他 很 多 语言 提供 的 REPL 即 时 运行 的 工具 。 同 时 它 可 以 生成 对 应 的 url， 非 常 适 合共 享 Go 语 言 
代码 片段 ， 汇 报 bug 或 提供 反馈 意见 等 。 


基于 Playground 构建 的 Go Tour > https://tour.golang.org ， 是 一 个 系列 的 Go 语言 入 门 教程 ， 
它 包 含 了 诸多 基本 概念 和 结构 相关 的 并 可 在 线 运行 的 互动 小 程序 。 


当然 ，Playground 和 Tour 也 有 一 些 限制 ， 它 们 只 能 导入 标准 库 ， 而 且 因 为 安全 的 原因 对 一 些 
网 络 库 做 了 限制 。 如 果 要 在 编译 和 运行 时 需要 访问 互联 网 ， 对 于 一 些 更 复杂 的 实验 ， 你 可 能 
需要 在 自己 的 电脑 上 构建 并 运行 程序 。 幸 运 的 是 下 载 Go 语 言 的 过 程 很 简单 ， 从 
https://golang.org 下 载 安 装 包 应 该 不 超过 几 分 钟 (译注 : 感谢 伟大 的 长 城 ， 让 大 陆 的 Gopher 
们 都 学 会 了 自己 打 洞 的 基本 生活 技能 ， 下 载 时 间 可 能 会 因为 洞 的 大 小 等 因素 从 几 分 钟 到 几 天 
REA) ， 然 后 就 可 以 在 自己 电脑 上 编写 和 运行 Go 程序 了 。 

Go 语言 是 一 个 开源 项 目 ， 你 可 以 在 https://golang.org/pkg 阅读 标准 库 中 任意 函数 和 类 型 的 实 
现代 码 ， 和 下 载 安装 包 的 代码 完全 一 致 。 这 样 你 可 以 知道 很 多 函数 是 如 何 工作 的 ， 通 过 挖 气 
找 出 一 些 答案 的 细节 ， 或 者 仅仅 是 出 于 欣赏 专业 级 Go 代码 。 
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第 一 草 ATT 


本 章 介 绍 Go 语 言 的 基础 组 件 。 本 章 提 供 了 足够 的 信息 和 示例 程序 ， 和 希望 可 以 帮 你 尽快 入 门 , 5 
出 有 用 的 程序 。 本 章 和 之 后 章节 的 示例 程序 都 针对 你 可 能 遇 到 的 现实 案例 。 先 了 解 几 个 Go 程 


序 ， 涉 及 的 主题 从 简单 的 文件 处 理 、 图 像 处 理 到 互联 网 客户 端 和 服务 端 并 发 。 当 然 ， 第 一 章 
不 会 解释 细 枝 术 节 ， 但 用 这 些 程序 来 学 习 一 门 新 语言 还 是 很 有 效 的 。 


学 习 一 门 新 语言 时 ， 会 有 一 种 自然 的 倾向 , 按照 自己 熟悉 的 语言 的 套路 写 新 语言 程序 。 学 习 Go 


语言 的 过 程 中 ， 请 警惕 这 种 想法 ， 尽 量 别 这 么 做 。 我 们 会 演示 怎么 写 好 Go 语言 程序 ， 所 以 请 
使 用 本 书 的 代码 作为 你 自己 写 程序 时 的 指南 。 


1.1. Hello, World 


我 们 以 现 已 成 为 传统 的 “hello world” 案 例 来 开始 吧 , 这 个 例子 首次 出 现 于 1978 年 出 版 的 C 语 言 
圣经 《The C Programming Language》1 。C 语 言 是 直接 影响 Go 语言 设计 的 语言 之 一 。 这 个 
例子 体现 了 Go 语言 一 些 核心 理念 。 


gopl.io/ch1/helloworld 


package main 
import "fmt" 


func main() { 
fmt.Printin("Hello, +5") 


} 


Go 是 一 门 编译 型 语言 ，Go 语 言 的 工具 链 将 源 代 码 及 其 依赖 转换 成 计算 机 的 机 器 指令 2 。Go 语 
言 提供 的 工具 都 通过 一 个 单独 的 命令 go 调用 ， go 命令 有 一 系列 子 命令 。 最 简单 的 一 个 子 命 
邻 就 是 run。 这 个 命令 编译 一 个 或 多 个 以 .go 结尾 的 源 文件 ， 链 接 库 文件 ， 并 运行 最 终生 成 的 可 
执行 文件 。 (本 书 使 用 $ 表 示 命 令 行 提 示 符 。) 


$ go run helloworld.go 


Hello, 世界 


Go 语言 原生 支持 Unicode， 它 可 以 处 理 全 世界 任何 语言 的 文本 。 


如 果 不 只 是 一 次 性 实验 ， 你 肯定 希望 能 够 编译 这 个 程序 ， 保 存 编译 结果 以 备 将 来 之 用 。 可 以 
用 build 子 命令 : 


$ go build helloworld.go 


这 个 命令 生成 一 个 名 为 helloworld 的 可 执行 的 二 进 制 文件 3， 之 后 你 可 以 随时 运行 它 4， 不 需 任 
何 处 理 9 。 


$ ./helloworld 
Hello, 世界 


本 书 中 , 所 有 的 示例 代码 上 都 有 一 行 标 记 ， 利 用 这 些 标 记 , 可 以 从 gopl.io 网 站 上 本 书 源码 仓库 
里 获取 代码 : 


gopl.io/chi/helloworld 


执行 go get gopl.io/chi/helloworld 命令 ， 就 会 从 网 上 获取 代码 ， 并 放 到 对 应 目 录 中 6 ° 2.6 
和 10.7 节 有 这 方面 更 详细 的 介绍 。 


来 讨论 下 程序 本 身 。Go 语 言 的 代码 通过 包 (package) 组 织 ， 包 类 似 于 其 它 语言 里 的 库 
(libraries) 或 者 模块 (modules) 。 一 个 包 由 位 于 单个 目录 下 的 一 个 或 多 个 .go 源 代码 文件 组 
成 ， 目 录 定 义 包 的 作用 i 每 个 源 文 件 都 以 一 条 package 声明 语句 开始 ， 这 个 例子 里 就 

是 package main, 表示 该 文件 属于 哪个 包 ， 紧 跟着 一 系列 导入 (import) 的 包 ， 之 后 是 存储 在 
这 个 文件 里 的 程序 语 钉 。 

Go 的 标准 库 提供 了 100 多 个 包 ， 以 支持 常见 功能 ， 如 输入 、 输 出 、 排 序 以 及 文本 处 理 。 比 


如 fmt 包 ? 就 含有 格式 化 输出 By 接收 输入 的 Bx o Println 是 其 中 一 个 基础 hr? 可 以 打 印 
以 室 格 间隔 的 一 个 或 多 个 值 ， 并 在 最 后 添加 一 个 换行 符 ， 从 而 输出 一 整 行 。 


main 包 比 较 特 殊 。 它 定义 了 一 个 独立 可 执行 的 程序 ， 而 不 是 一 个 库 。 在 main 里 的 main BH 
数 也 很 特殊 ， 它 是 整个 程序 执行 时 的 入 口 / 。main 函数 所 做 的 事情 就 是 程序 做 的 。 当 然 
f > main 函数 一 般 调 用 其 它 包 里 的 函数 完成 很 多 工作 ， 比如 fmt.Println ° 


必须 告诉 编译 器 源 文件 需要 哪些 包 ， 这 就 是 Import 声明 以 及 随后 的 package P 明 扮演 的 角 
色 。hello world 例 子 只 用 到 了 一 个 包 ， 大 多 数 程序 需要 导入 多 个 包 。 


必须 恰当 导入 需要 的 包 ， 缺 少 了 必要 的 包 或 者 导入 了 不 需要 的 包 ， 程 序 都 无 法 编译 通过 。 这 
项 严格 要 求 避 免 了 程序 开发 过 程 中 引入 未 使 用 的 包 8 。 


import 声明 必须 跟 在 文件 的 package 声明 之 后 。 随 后 ， 则 是 组 成 程序 的 函数 、 交 量 、 常 量 、 
类 型 的 声明 语句 (分别 由 关键 字 func, var, const, type EL) 。 这 些 内 容 的 声明 顺序 并 
不 重要 9。 这 个 例子 的 程序 已 经 尽 可 能 短 了 ， 只 声明 了 一 个 函数 , 其 中 只 调用 了 一 个 其 他 十 
数 。 为 了 节省 篇 幅 ， 有 些 时 候 , 示例 程序 会 省 略 package 和 import 声明 ， 但 是 ， 这 些 声明 在 
源 代码 里 有 ， 并 且 必 须 得 有 才能 编译 。 


一 个 函数 的 声明 由 func 关键 字 、 遂 数 名 、 参 数列 表 、 返 回 值 列 表 (这 个 例子 里 的 main HR 
参数 列表 和 返回 值 都 是 空 的 ) 以 及 包含 在 大 括号 里 的 防 数 体 组 成 。 第 五 章 进 一 步 考察 函数 。 


Go 语言 不 需要 在 语句 或 者 声明 的 末尾 添加 分 号 ， 除 非 一 行 上 有 多 条 语句 。 实 际 上 ， 编 译 器 会 
主动 把 特定 符号 后 的 换行 符 转换 为 分 号 , 因此 换行 符 添加 的 位 置 会 影响 Go 代码 的 正确 解析 
10 。。 KAIF, 函数 的 左 括 号 { 必须 和 func 函数 声明 在 同一 行 上 , 且 位 于 末尾 ， 不 能 独占 
一 行 ， 而 在 表达 式 x+y 中 ， 可 在 + 后 换行 ， 不 能 在 + 前 换行 。 


Go 语言 在 代码 格式 上 采取 了 很 强硬 的 态度 。 gofmt 工具 把 代码 格式 化 为 标准 格式 12， 并 

且 go 工具 中 的 fmt 子 命令 会 对 指定 包 , 否则 默认 为 当前 目录 , 中 所 有 .go 源 文件 应 用 gofmt 命 
令 。 本 书 中 的 所 有 代码 都 被 gofmt 过 。 你 也 应 该 养 成 格式 化 自己 的 代码 的 习惯 。 以 法 令 方 式 规 
定 标准 的 代码 格式 可 以 避免 无 尽 的 无 意义 的 琐碎 争 执 13。 更 重要 的 是 ， 这 样 可 以 做 多 种 自动 
源码 转换 ， 如 果 放 任 Go 语 言 代 码 格式 ， 这 些 转换 就 不 大 可 能 了 。 


很 多 文本 编辑 器 都 可 以 配置 为 保存 文件 时 自动 执行 gofmt ， 这 样 你 的 源 代 码 总 会 被 恰当 地 格 
式 化 。 还 有 个 相关 的 工具 ， goimports ， 可 以 根据 代码 需要 , 自动 地 添加 或 删除 import 声 
明 。 这 个 工具 并 没有 包含 在 标准 的 分 发 包 中 ， 可 以 用 下 面 的 命令 安装 : 


$ go get golang.org/x/tools/cmd/goimports 
对 于 大 多 数 用 户 来 说 ， 下 载 、 编 译 包 、 运 行 测试 用 例 、 察 看 Go 语言 的 文档 等 等 常用 功能 都 可 
以 用 go 的 工具 完成 。10.7 节 详细 介绍 这 些 知 识 。 


1. 本 书 作 者 之 一 Brian W. Kernighan 也 是 《The C Programming Language》 一 书 的 作 
are es 


2 HARE © 

3. Windows 系 统 下 生成 的 可 执行 文件 是 helloworld.exe， 增 加 了 .exe 后 级 名 。 品 
4 在 Windows 系 统 下 在 命令 行 直接 输入 helloworld.exe 命 令 运行 。e 

5. 因为 静态 编译 ， 所 以 不 用 担心 在 系统 库 更 新 的 时 候 冲突 ， 幸 福 感 满 满 。e 


6 需要 先 安装 Git 或 Hg 之 类 的 版 本 管理 工具 ， 并 将 对 应 的 命令 添加 到 PATH 环境 变量 中 。 
序言 已 经 提 及 ， 需 要 先 设 置 好 GOPATH 环 境 变 量 ， 下 载 的 代码 会 放 
在 $GOPATH/src/gopl.io/chi/helloworld Ake e 


T CAB SZRSMRHo e 


8 Go 语言 编译 过 程 没有 警告 信息 ， 争 议 特 性 之 一 。 吕 


10 比如 行 末 是 标识 符 、 整 数 、 浮 点 数 、 虐 数 、 字 符 或 字符 串 文 字 、 关 键 


= EE 大 大 


Ea break `œ continue `œ fallthrough 或 return 中 的 一 个 3 运算 符 和 分 隔 符 ++ ` 
“本 Merete e 


11, 以 + 结尾 的 话 不 会 被 插入 分 号 分 隔 符 ， 但 是 以 X 结 尾 的 话 则 会 被 分 号 分 隔 符 ， 从 而 导致 


编译 错误 。 全 


12 这 个 格式 化 工具 没有 任何 可 以 调整 代码 格式 的 参数 ，Go 语 言 就 是 这 么 任性 。 e 
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Go 语言 圣经 


13. 也 导致 了 Go 语言 的 TIOBE 排 名 较 低 ， 因 为 缺少 括 逼 的 话题 e 
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1.2. 命令 行 参数 


大 多 数 的 程序 都 是 处 理 输入 ， 产 生 输 出 ; 这 也 正 是 “计算 "的 定义 。 但 是 , 程序 如 何 获取 要 处 理 
的 输入 数据 呢 ? 一 些 程序 生成 自己 的 数据 ， 但 通常 情况 下 ， 输 入 来 自 于 程序 外 部 : 文件 、 网 
络 连 接 、 其 它 程序 的 输出 、 敲 键盘 的 用 户 、 命 令 行 参 数 或 其 它 类 似 输 入 源 。 下 面 几 个 例子 会 
讨论 其 中 几 个 输入 源 ， 首 先是 命令 行 参数 。 


os 包 以 跨 平台 的 方式 ， 提 供 了 一 些 与 操作 系统 交互 的 函数 和 变量 。 程 序 的 命令 行 参 数 可 从 OS 
包 的 Args 变 量 获取 ; os 包 外 部 使 用 os.Args 访 问 该 变量 。 


os.Args 变 量 是 一 个 字符 串 〈string) 的 切片 (slice) (译注 : slice 和 Python 语言 中 的 切片 类 
似 ， 是 一 个 简 版 的 动态 数组 ) ， 切 片 是 Go 语言 的 基础 概念 ， 稍 后 详细 介绍 。 现 在 先 把 切片 S 当 
作 数 组 元 素 序 列 , 序列 的 成 长 度 动态 变化 , 用 s[i] 访问 单个 元 素 ， 用 s[m:n] 获取 子 序列 ( 译 
È : 和 python 里 的 语法 差不多 )。 序 列 的 元 素数 目 为 len(S)。 和 大 多 数 编程 语言 类 似 ， 区 间 索 引 
时 ，Go 言 里 也 采用 左 闭 右 开 形 式 , 即 ， 区 间 包 括 第 一 个 索引 元 素 ， 不 包括 最 后 一 个 , 因为 这 样 
可 以 简化 逻辑 。 (译注 : 比如 a = [1, 2, 3, 4, 5], a[0:3] = [1, 2, 3] ， 不 包含 最 后 一 个 元 素 ) 。 比 
如 s[m:n] 这 个 切片 ，0 < m < n<len(s)， 包 含 h-m 个 元 素 。 


OS.Args 的 第 一 个 元 素 ，OS.Args[0], 是 命令 本 身 的 名 字 ; 其 它 的 元 素 则 是 程序 启动 时 传 给 它 的 
参数 。s[m:n] 形 式 的 切片 表达 式 ， 产 生 从 第 m 个 元 素 到 第 n-1 个 元 素 的 切片 ， 下 个 例子 用 到 的 
元 素 包含 在 os.Args[1:len(os.Args)] 切 片 中 。 如 果 省 略 切 片 表达 式 的 m 或 n， 会 默认 传 入 0 或 
len(s)， 因 此 前 面 的 切片 可 以 简写 成 os.Args[1:] 。 

下 面 是 Unix 里 echo 命 令 的 一 份 实现 ，echo 把 它 的 命令 行 参数 打印 成 一 行 。 程 序 导入 了 两 个 
包 ， 用 括号 把 它们 括 起 来 写成 列表 形式 , 而 没有 分 开 写 成 独立 的 import 声明 。 两 种 形式 都 合 
法 ， 列 表 形 式 习 惯 上 用 得 多 。 包 导入 顺序 并 不 重要 ; gofmt 工 具 格式 化 时 按照 字母 顺序 对 包 名 
排序 。 (示例 有 多 个 版 本 时 ， 我 们 会 对 示例 编号 , 这 样 可 以 明确 当前 正在 讨论 的 是 哪个 。) 


gopl.io/ch1/echo1 


// Echol prints its command-line arguments. 


package main 


import ( 
fa 
Su 

) 


func main() { 
var s, sep string 
for i := 1; i < len(os.Args); i++ { 
s += sep + os.Args[i] 
sep =" " 


} 
fmt.Println(s) 


注释 语句 以 // 开头 。 对 于 程序 员 来 说 ，// 之 后 到 行 末 之 间 所 有 的 内 容 都 是 注释 ， 被 编译 器 忽 
略 。 按 照 惯 例 ， 我 们 在 每 个 包 的 包 声 明 前 添加 注释 ; 对 于 main package ， 注 释 包 含 一 句 或 几 
名 话 ， 从 整体 角度 对 程序 做 个 描述 。 


var 声 明定 义 了 两 个 string 类 型 的 变量 sS 和 sep。 变 量 会 在 声明 时 直接 初始 化 。 如 果 变 量 没 有 显 
式 初始 化 ， 则 被 隐 式 地 赋予 其 类 型 的 零 值 (zero value) ， 数 值 类 型 是 0， 字 符 串 类 型 是 空 字 
符 串 "%。 这 个 例子 里 ， 声 明 把 s 和 sep 隐 式 地 初始 化 成 空 字符 事 。 第 2 章 再 来 详细 地 讲解 变量 和 
声明 。 


及 


对 数值 类 型 ，Go 语 言 提供 了 常规 的 数值 和 这 辑 运 算 符 。 而 对 string 类 型 ，+ 运算 符 连 接 字符 
$ (译注 : 和 C++ 或 者 js 是 一 样 的 ) 。 所 以 表达 式 : 


sep + os.Args[i] 


表示 连接 字符 串 sep 和 os.Args。 程 序 中 使 用 的 语句 : 


s += sep + os.Args[i] 
是 一 条 赋值 语句 , 将 S 的 昌 值 跟 sep 与 0s.Args[i] 连 接 后 赋值 回 s， 等 价 于 : 
s = s + sep + os.Args[i] 


运算 符 += 是 赋值 运算 符 (assignment operator) ， 每 种 数值 运算 符 或 逻辑 运算 符 ， 
如 + 或 *， 都 有 对 应 的 赋值 运算 符 。 


echo 程 序 可 以 每 循环 一 次 输出 一 个 参数 ， 这 个 版 本 却 是 不 断 地 把 新 文本 追加 到 末尾 来 构造 字 
符 串 。 字 符 串 s 开 始 为 室 ， 即 值 为 "， 每 次 循环 会 添加 一 些 文本 ; 第 一 次 迭代 之 后 ， 还 会 再 插 
入 一 个 空格 ， 因 此 循环 结束 时 每 个 参数 中 间 都 有 一 个 空格 。 这 是 一 种 二 次 加 工 (quadratic 
process) ， 当 参数 数量 庞大 时 ， 开 销 很 大 ， 但 是 对 于 echo， 这 种 情形 不 大 可 能 出 现 。 本 章 会 
介绍 echo 的 若干 改进 版 ， 下 一 章 解 决 低 效 问题 。 


循环 索引 变量 i 在 for 循 环 的 第 一 部 分 中 定义 。 符 号 := 是 短 变量 声明 (short variable 
declaration) 的 一 部 分 , 这 是 定义 一 个 或 多 个 变量 并 根据 它们 的 初始 值 为 这 些 变量 赋予 适当 类 
型 的 语句 。 下 一 章 有 这 方面 更 多 说 明 。 


自 增 语句 i++ 给 1 加 1; 这 和 i+r=1d 以 及 1i=i+1 都 是 等 价 的 。 对 应 的 还 有 i-- Siw 
1° 它们 是 语句 ， 而 不 像 C 系 的 其 它 语言 那样 是 表达 式 。 所 以 j = i++ 非法 ， 而 且 ++ 和 -- 都 只 
能 放 在 变量 名 后 面 ， 因 此 --i 也 非法 。 


Go 语言 只 有 for 循 环 这 一 种 循环 语句 。for 循 环 有 多 种 形式 ， 其 中 一 种 如 下 所 示 : 


for initialization; condition; post { 
// zero or more statements 


} 


for 循 环 三 个 部 分 不 需 括号 包围 。 大 括号 强制 要 求 , 左 大 括号 必须 和 post 语 和 句 在 同一 行 。 


initialization 语 句 是 可 选 的 ， 在 循环 开始 前 执行 。initalization 如 果 存 在 ， 必 须 是 一 条 简单 语句 
(simple statement) ， 即 ， 短 变量 声明 、 自 增 语句 、 赋 值 语句 或 函数 调用 。 condition 是 一 
个 布尔 表达 式 (boolean expression) ， 其 值 在 每 次 循环 和 迭代 开始 时 计算 。 如 果 为 true 则 执 
行 循环 体 语句 。 post 1& 多 在 循环 体 执行 结束 后 执行 ， 之 后 再 次 对 conditon 求 

值 。 condition 值 为 false 时 ， 循 环 结束 。 


for 循 环 的 这 三 个 部 分 每 个 都 可 以 省 略 ， 如 果 省 略 initialization 和 post ， 分 号 也 可 以 省 
whe: 


// a traditional "while" loop 
for condition { 
Lie Morais 


} 


如 果 连 condition 也 省 略 了 ， 像 下 面 这 样 : 


// a traditional infinite loop 


这 就 变 成 一 个 无 限 循环 ， 尽管 如 此 ’ 还 可 以 用 其 他 方式 终止 循环 ， 如 一 条 break 或 return 语 
ajo 


for 循环 的 另 一 种 形式 , 在 某 种 数据 类 型 的 区 间 (range) 上 遍历 ， 如 字符 串 或 切 
片 。 echo 的 第 二 版 本 展示 了 这 种 形式 : 


gopl.io/ch1/echo2 


// Echo2 prints its command-line arguments. 


package main 


import ( 
es 
Woe 
) 


func main() { 


S, Sep := 1i, 
for _, arg := range os.Args[1:] { 
s += sep + arg 
sep = W " 


} 
fmt.Println(s) 


每 次 循环 和 迭代， range 产生 一 对 值 ; 索引 以 及 在 该 索引 处 的 元 素 值 。 这 个 例子 不 需要 索引 ， 
但 range 的 语法 要 求 , 要 处 理 元 素 , 必须 处 理 索 引 。 一 种 思路 是 把 索引 赋值 给 一 个 临时 变量 ， 

如 temp ,然后 忽略 它 的 值 ， 但 Go 语言 不 允许 使 用 无 用 的 局 部 变量 (local variables) ， 因 为 这 
会 导致 编译 错误 。 


Go 语言 中 这 种 情况 的 解决 方法 是 用 空 标识 符 (blank identifier) > PP (也 就 是 下 划 线 ) © 
空 标识 符 可 用 于 任何 语法 需要 变量 名 但 程序 逻辑 不 需要 的 时 候 , 例如 , 在 循环 里 ， 丢 弃 不 需要 
的 循环 索引 , 保留 元 素 值 。 大 多 数 的 Go 程序 员 都 会 像 上 面 这 样 使 用 range 和 B echo 程 
序 ， 因 为 隐 式 地 而 非 显示 地 索引 os.Args， 容 易 写 对 。 


echo 的 这 个 版 本 使 用 一 条 短 变 量 声明 来 声明 并 初始 化 s 和 seps ， 也 可 以 将 这 两 个 变量 分 开 
声明 ， 声 明 一 个 变量 有 好 几 种 方式 ， 下 面 这 些 都 等 价 : 


S = mau 
var s string 
var s=t" 


var s string = "" 


用 哪 种 不 用 哪 种 ， 为 什么 呢 ? 第 一 种 形式 ， 是 一 条 短 变量 声明 ， 最 简洁 ， 但 只 能 用 在 函数 内 
部 ， 而 不 能 用 于 包 变 量 。 第 二 种 形式 依赖 于 字符 串 的 黑 认 初始 化 零 值 机 制 ， 被 初始 化 为 "。 第 
三 种 形式 用 得 很 少 ， 除 非 同时 声明 多 个 变量 。 第 四 种 形式 显 式 地 标明 变量 的 类 型 ， 当 变量 类 


型 与 初 值 类 型 相同 时 ， 类 型 宛 余 ， 但 如 果 两 者 类 型 不 同 ， FS 
用 前 两 种 形式 中 的 某 个 ， 初 始 值 重要 的 话 就 显 式 地 指定 变量 的 


类 型 就 必须 了 。 实 践 中 一 般 使 
类 型 ， 否 则 使 用 隐 式 初始 化 。 


aN ie ete ee er are 
产生 新 字符 串 , 并 把 它 赋 值 给 s o s 原来 的 内 容 已 经 不 再 使 用 ， 将 在 适当 时 机 对 它 进 行 垃圾 
回收 。 


如 果 和 连接 涉及 的 数据 量 很 大 ， 这 种 方式 代价 高 咒 。 一 种 简单 且 高 效 的 解决 方案 是 使 
用 strings 包 的 Join 函数 : 


gopl.io/ch1/echo3 


func main() { 
fmt.Println(strings.Join(os.Args[i:], " ")) 
} 


最 后 ， 如 果 不 关心 输出 格式 ， 只 想 看 看 输出 值 ， 或许 只 是 为 了 调试 ， 可 以 用 println 为 我 们 
格式 化 输出 。 


fmt.Println(os.Args[1:]) 


这 条 语句 的 输出 结果 跟 strings. Join 得 到 的 结果 很 像 ， 只 是 被 放 到 了 一 对 方 括号 里 。 切 片 都 
会 被 打印 成 这 种 格式 。 


练习 1.1 : 修改 echo 程序 ， 使 其 能 够 打印 os.Args[0] ， 即 被 执行 命令 本 身 的 名 字 。 
练习 1.2 : 修改 echo 程序 ， 使 其 打印 每 个 参数 的 索引 和 值 ， 每 个 一 行 。 


练习 1.3 : 做 实验 测量 潜在 低 效 的 版 本 和 使 用 了 strings.Join 的 版 本 的 运行 时 间 差 异 。 (1.6 
节 讲 解 了 部 分 time 包 ，11.4 节 展示 了 如 何 写 标准 测试 程序 ， 以 得 到 系统 性 的 性 能 评测 。) 


1.3. 查找 重复 的 行 


对 文件 做 找 贝 、 打 印 、 搜 索 、 排 序 、 统 计 或 类 似 事情 的 程序 都 有 一 个 差不多 的 程序 结构 : 一 
个 处 理 输入 的 循环 ， 在 每 个 元 素 上 执行 计算 处 理 ， 在 处 理 的 同时 或 最 后 产生 输出 。 我 们 会 展 
示 一 个 名 为 dup 的 程序 的 三 个 版 本 ; 灵感 来 自 于 Unix 的 uniq 命令 ， 其 寻找 相 邻 的 重复 行 。 
该 程序 使 用 的 结构 和 包 是 个 参考 范例 ， 可 以 方便 地 修改 。 


dup 的 第 一 个 版 本 打印 标准 输入 中 多 次 出 现 的 行 ， 以 重复 次 数 开 头 。 该 程序 将 引入 if 语 
4] > map 数据 类 型 以 及 bufio 包 。 


gopl.io/ch1/dup1 


// Dup1 prints the text of each line that appears more than 
// once in the standard input, preceded by its count. 
package main 


import ( 
"bufio" 
"Fmt" 
Nos" 


) 


func main() { 
counts := make(map[string]int) 
input := bufio.NewScanner(os.Stdin) 
for input.Scan() { 
counts[input.Text()]++ 


} 
// NOTE: ignoring potential errors from input.Err() 
for line, n := range counts { 

i > at 


fmt.Printf("%d\t%s\n", n, line) 
} 


正如 for 循环 一 样 ， if 语句 条 件 两 边 也 不 加 括号 ， 但 是 主体 部 分 需要 加 。 if 语句 
的 else 部 分 是 可 选 的 ， 在 if HAHA false 时 执行 。 


map 存 储 了 键 / 值 (key/value) 的 集合 ， 对 集合 元 素 ， 提 供 常数 时 间 的 存 、 取 或 测试 操作 。 键 
可 以 是 任意 类 型 ， 只 要 其 值 能 用 == BHP MR RHUL PEP ; 值 则 可 以 是 任意 类 
型 。 这 个 例子 中 的 键 是 字符 串 ， 值 是 整数 。 内 置 函 数 make 创建 空 map ， 此 外 ， 它 还 有 别 的 
作用 。4.3 节 讨论 map 。 


(译注 ; 从 功能 和 实现 上 说 ，Go 的 map 类 似 于 Java 语言 中 的 HashMap ，Python 语 言 中 
的 dict > Lua 语言 中 的 table ， 通 常 使 用 hash 实现 。 遗 憾 的 是 ， 对 于 该 词 的 翻译 并 不 统 


一 ， 数 学 界 术 语 为 映射 ， 而 计算 机 办 众说 纷 颖 莫衷一是 。 为 了 防止 对 读者 造成 误解 ， 保 留 不 
译 。) 


人 


每 次 dup 读 取 一 行 输入 ， 该 行 被 当做 map ， 其 对 应 的 值 递增 。 counts[input.Text()]++ 语句 
等 价 下 面 两 名 : 


line := input.Text() 
counts[line] = counts[line] + 1 


map 中 不 含 某 个 键 时 不 用 担心 ， 首 次 读 到 新 行 时 ， 等 号 右边 的 表达 式 counts[line] 的 值 将 被 
计算 为 其 类 型 的 零 值 ， 对 于 int* 即 0 o 


为 了 打印 结果 ， 我 们 使 用 了 基于 range 的 循环 ， 并 在 counts 这 个 map 上 和 迭代 。 跟 之 前 类 

似 ， 每 次 迭代 得 到 两 个 结果 ， 键 和 其 在 map 中 对 应 的 值 。 map 的 迭代 顺序 并 不 确定 ， 从 实践 
来 看 ， 该 顺序 随机 ， 每 次 运行 都 会 变化 。 这 种 设计 是 有 意 为 之 的 ， 因 为 能 防止 程序 依赖 特定 
遍历 顺序 ， 而 这 是 无 法 保证 的 。 

继续 来 看 bufio 包 ， 它 使 处 理 输入 和 输出 方便 又 高 效 。 scaner 类 型 是 该 包 最 有 用 的 特性 之 
一 ， 它 读 取 和 输入 并 将 其 拆 成 行 或 单词 ; 通常 是 处 理 行 形式 的 输入 最 简单 的 方法 。 


程序 使 用 短 变 量 声明 创建 bufio.scanner 类 型 的 变量 input ° 


input := bufio.NewScanner(os.Stdin) 


该 变量 从 程序 的 标准 输入 中 读 取 内 容 。 每 次 调用 input.scanner ， 即 读 入 下 一 行 ， 并 移 除 行 末 
的 换行 符 ; 读 取 的 内 容 可 以 调用 input.Text() 得 到 。 scan 函数 在 读 到 一 行 时 返回 true ， 在 
无 输入 时 返回 false ° 


类 似 于 C 或 其 它 语言 里 的 printf 函数 ， Fmt. Printf 函数 对 一 些 表 达 式 产 生 格 式 化 输出 ° 该 函 
数 的 首 个 参数 是 个 格式 字符 串 ， 指 定 后 续 参 数 被 如 何 格式 化 。 各 个 参数 的 格式 取决 于 “转换 字 
符 ” (conversion character) ， 形 式 为 百 分 号 后 跟 一 个 字母 。 举 个 例子 ，w%d 表示 以 十 进 制 形 
式 打 印 一 个 整 型 操作 数 ， 而 %s 则 表示 把 字符 串 型 操作 数 的 值 展开 。 


printf 有 一 大 堆 这 种 转换 ，Go 程 序 员 称 之 为 动词 (verb) 。 下 面 的 表格 虽然 远 不 是 完整 的 规 
范 ， 但 展示 了 可 用 的 很 多 特性 : 


%d 
%x, %0, %b 
%f, %g, %e 
%t 
%C 
%S 
%q 
%V 
%T 
%% 


十 进 制 整数 

十 六 进 制 ， 八 进 制 ， 二 进 制 整数 。 

浮 点 数 : 3.141593 3.141592653589793 3.141593e+00 
布尔 : true 或 false 

字符 (rune) (Unicode 码 点 ) 

FHF 

带 双 引号 的 字符 串 "abc" 或 带 单 引 号 的 字符 'c' 

变量 的 自然 形式 (natural format) 

变量 的 类 型 

字面 上 的 百 分 号 标志 (无 操作 数 ) 


dupt 的 格式 字符 串 中 还 含有 制 表 符 \t 和 换行 符 n 。 字 符 串 字面 上 可 能 含有 这 些 代表 不 可 
见 字符 的 转 义 字符 (escap sequences) 。 默 认 情 况 下 ， printf 不 会 换行 。 按 照 惯例 ， 以 字 
E f 结尾 的 格式 化 函数 ， 如 log.Printf 和 fmt.Errorf ， 都 采用 fmt.printf 的 格式 化 准则 。 
而 以 ln 结尾 的 格式 化 函数 ， 则 遵循 Println 的 方式 ， 以 跟 w 差不多 的 方式 格式 化 参数 ， 并 
在 最 后 添加 一 个 换行 符 i (译注 : EA f 48 fomart ， ln 48 line ° ) 


很 多 程序 要 么 从 标准 输入 中 读 取 数据 ， 如 上 面 的 例子 所 示 ， 要 么 从 一 系列 具名 文件 中 读 取 数 
据 。 dup 程序 的 下 个 版 本 读 取 标准 输入 或 是 使 用 os.open 打开 各 个 具名 文件 ， 并 操作 它们 。 


gopl.io/ch1/dup2 


// Dup2 prints the count and text of lines that appear more than once 
// in the input. It reads from stdin or from a list of named files. 
package main 


import ( 
ABURTO 
UEMS 
Nog" 

) 


func main() { 
counts := make(map[string]int) 
files := os.Args[i:] 
if len(files) == 0 { 
countLines(os.Stdin, counts) 
} else { 


for _, arg range files { 


f, err := os.Open(arg) 
if err != nil { 
fmt.Fprintf(os.Stderr, "dup2: %v\n", err) 
continue 
} 
countLines(f, counts) 
f.Close() 
} 
} 
for line, n := range counts { 
ir > 
fmt.Printf("%d\t%s\n", n, line) 
} 
} 


func countLines(f *os.File, counts map[string]int) { 
input := bufio.NewScanner(f) 
for input.Scan() { 
counts[input.Text()]++ 


} 


// NOTE: ignoring potential errors from input.Err() 


os.Open RARE MMA o FH — ie AT FAY LE *os.File ) ， 其 后 被 scanner 读 取 。 


os.Open 返回 的 第 二 个 值 是 内 置 error 类 型 的 值 。 如 果 err FTA RM nil (译注 : 相当 于 
其 它 语言 里 的 NULL) ， 那 么 文件 被 成 功 打开 。 读 取 文 件 ， 直 到 文件 结束 ， 然 后 调用 close 关 
闭 该 文件 ， 并 释放 占用 的 所 有 资源 。 相 反 的 话 ， 如 果 err 的 值 不 是 nil ， 说 明 打 开 文 件 时 出 
错 了 。 这 种 情况 下 ， 错 误 值 描述 了 所 遇 到 的 问题 。 我 们 的 错误 处 理 非常 简单 ， 只 是 使 

用 Fprintf 与 表示 任意 类 型 默认 格式 值 的 动词 wx ， 向 标准 错误 流 打 印 一 条 信息 ， 然 

后 dup 继续 处 理 下 一 个 文件 ; continue 语句 直接 跳 到 for 循环 的 下 个 迭代 开始 执行 。 


为 了 使 示例 代码 保持 合理 的 大 小 ， 本 书 开 始 的 一 些 示 例 有 意 简 化 了 错误 处 理 ， 显 而 昂 见 的 

是 ， 应 该 检查 os.0pen 返回 的 错误 值 ， 然 而 ， 使 用 input.scan 读 取 文件 过 程 中 ， 不 大 可 能 
现 错误 ， 因 此 我 们 忽略 了 错误 处 理 。 我 们 会 在 跳 过 错误 检查 的 地 方 做 说 明 。5.4 节 中 深入 介绍 
TITRA o 


注意 countLines 函数 在 其 声明 前 被 调 有 用。 函数 和 包 级 别 的 变量 (package-level entities) 可 
以 任意 顺序 声明 ， 并 不 影响 其 被 调用 。 (译注 : 最 好 还 是 遵循 一 定 的 规范 


map 是 一 个 由 make 函数 创建 的 数据 结构 的 引用 。 map YEA A RBG IBD BB > 该 函数 
接收 这 个 引用 的 一 份 找 贝 (copy， 或 译 为 副本 ) ， 被 调用 函数 对 map 底层 数据 结构 的 任何 修 
改 ， 调 用 者 函数 都 可 以 通过 持 有 的 map 引用 看 到 。 在 我 们 的 例子 中 ， countLines BA 

向 counts 插入 的 值 ， 也 会 被 main 函数 看 到 。 (译注 : 类 似 于 C++ 里 的 引用 传递 ， 实 际 上 指 
针 是 另 一 个 指针 了 ， 但 内 部 存 的 值 指 向 同一 块 内 存 ) 


dup 的 前 两 个 版 本 以 " 流 "模式 读 取 输 入 ， 并 根据 需要 拆 分 成 多 个 行 。 理 论 上 ， 这 些 程 序 可 以 处 
理 任 意 数量 的 输入 数据 。 还 有 另 一 个 方法 ， 就 是 一 口气 把 全 部 输入 数据 读 到 内 存 中 ， 一 次 分 
割 为 多 行 ， 然 后 处 理 它 们 。 下 面 这 个 版 本 ， dup ， 就 是 这 么 操作 的 。 这 个 例子 引入 
了 ReadFile 函数 (来自 于 io/ioutil 包 ) ， 其 读 取 指定 文件 的 全 部 内 容 ， strings.split B 
数 把 字符 串 分 割 成 子 串 的 切片 。 ( Split 的 作用 与 前 文 提 到 的 strings.Join 相反 。) 


我 们 略微 简化 了 dup3 。 首 先 ， 由 于 ReadFile 函数 需要 文件 名 作为 参数 ， 因 此 只 读 指定 文 
件 ， 不 读 标准 输入 。 其 次 ， 由 于 行 计数 代码 只 在 一 处 用 到 ， 故 将 其 移 回 main HA ° 


gopl.io/ch 1/dup3 


package main 


import ( 
Menten 
iTo Touti 
Nos! 
"strings" 
) 
func main() { 
counts := make(map[string]int) 
for _, filename := range os.Args[i:] { 
data, err := ioutil.ReadFile(filename) 
if err != nil { 
fmt.Fprintf(os.Stderr, "dup3: %v\n", err) 
continue 
} 


for _, line := range strings.Split(string(data), "\n") { 
counts[line]++ 


} 
} 
for line, n := range counts { 
any (niet al af 
fmt .Printf("%d\t%s\n", n, line) 
} 
} 


ReadFile 喜 数 返回 一 个 字 节 切片 (byte slice) ， 必 须 把 它 转 换 为 string ， 才 能 
用 strings.split 分 割 。 我 们 会 在 3.5.4 节 详细 讲解 字符 囊 和 字 节 切片 。 


FILE > pufio.Scanner ` ioutil.ReadFile 和 ioutil.wWriteFile 都 使 

用 *os.File 的 Read 和 write 方法 ， 但 是 ， 大 多 数 程 序 员 很 少 需 要 直接 调用 那些 低级 
(lower-level) 函数 。 高 级 (higher-level) 43k > 1% bufio 和 io/ioutil 包 中 所 提供 的 那 
些 ， 用 起 来 要 容 多 点 。 


练习 1.4 : 修改 dup2 ， 出 现 重 复 的 行 时 打印 文件 名 称 。 


1.4. GIF 27 = 


下 面 的 程序 会 演示 Go 语言 标准 库 里 的 image 这 个 package 的 用 法 ， 我 们 会 用 这 个 包 来 生成 一 系 
列 的 bit-mapped 图 ， 然 后 将 这 些 图 片 编码 为 一 个 GIF 动画 。 我 们 生成 的 图 形 名 字 叫 利 萨 如 图 形 
(Lissajous figures)， 这 种 效果 是 在 1960 年 代 的 老 电影 里 出 现 的 一 种 视觉 特效 。 它 们 是 协 振 子 
在 两 个 纬度 上 振动 所 产生 的 曲线 ， 比 如 两 个 sin 正弦 波 分 别 在 X 轴 和 y 轴 输入 会 产生 的 曲线 。 图 
1.1 是 这 样 的 一 个 例子 : 


SO 





Figure 1.1. Four Lissajous figures. 


译注 : 要 看 这 个 程序 的 结果 ， 需 要 将 标准 输出 重 定向 到 一 个 GIF 图 像 文件 〈 使 用 ./lissajous 
> output.gif TA) 。 下 面 是 GIF 图 像 动画 效果 : 





这 段 代 码 里 我 们 用 了 一 些 新 的 结构 ， 包 括 const 声 明 ，struct 结 构 体 类 型 ， 复 合 声明 。 和 我 们 举 
的 其 它 的 例子 不 太一 样 ， 这 一 个 例子 包含 了 浮 点数 运算 。 这 些 概 念 我 们 只 在 这 里 简单 地 说 明 
一 下 ， 之 后 的 章节 会 更 详细 地 讲解 。 


gopl.io/ch1Aissajous 


// Lissajous generates GIF animations of random Lissajous figures. 
package main 


import ( 
"image" 
"image/color" 
"image/gif" 
Nao" 
"math" 
"math/rand" 
Nog" 


var palette = []color.Color{color.white, color.Black} 


const ( 
whiteIndex 
blackIndex = 1 // next color in palette 


9 // first color in palette 


func main() { 
lissajous(os.Stdout ) 


} 
func lissajous(out io.Writer) { 
const ( 
cycles =5 // number of complete x oscillator revolutions 
res = 0.001 // angular resolution 
size = 100 // image canvas covers [-size..+size] 
nframes = 64 // number of animation frames 
delay =8 // delay between frames in 10ms units 
) 
freq := rand.Float64() * 3.0 // relative frequency of y oscillator 
anim := gif.GIF{LoopCount: nframes} 
phase := 0.0 // phase difference 
for i := 0; i < nframes; i++ { 
rect := image.Rect(0, 0, 2*size+1, 2*size+1) 


img := image.NewPaletted(rect, palette) 
for t := 0.0; t < cycles*2*math.Pi; t += res { 
x math.Sin(t) 
y := math.Sin(t*freq + phase) 
img.SetColorIndex(sizetint(x*size+0.5), size+int(y*size+0.5), 
blackIndex ) 


} 
phase += 0.1 


anim.Delay = append(anim.Delay, delay) 
anim.Image = append(anim.Image, img) 


} 


gif.EncodeAll(out, &anim) // NOTE: ignoring encoding errors 


ena 一 个 包 路 径 包 含有 多 个 单词 的 package 时 ， 比 如 image/color (image 和 color 两 
fae) ， 通常 我 们 只 需要 用 人 包 就 可 以 。 所 以 当 我 们 写 colorWhite 
时 ， 这 个 变量 指向 的 是 image/color 包 里 的 变量 ， 同 理 gif.GIF 是 属于 image/gif 包 里 的 变量 。 


这 个 程序 里 的 常量 声明 给 出 了 一 系列 的 常量 值 ， 常 量 是 指 在 程序 编译 后 运行 时 始终 都 不 会 变 
化 的 值 ， 比 如 圈 数 、 帧 数 、 延 迟 值 。 常 量 声明 和 变量 声明 一 般 都 会 出 现在 包 级 别 ， 所 以 这 些 
常量 在 整个 包 中 都 是 可 以 共享 的 ， 或 者 你 也 可 以 把 常量 声明 定义 在 函数 体内 部 ， 那 么 这 种 党 
量 就 只 能 在 函数 体内 用 。 目 前 常量 声明 的 值 必 须 是 一 个 数字 值 、 字 符 串 或 者 一 个 固定 的 
boolean 值 。 


de ide 


[color.Color{...} 和 gif.GIF{...} 这 两 个 表达 式 就 是 我 们 说 的 复合 声明 (4.2 和 4.4.1 节 有 说 明 ) 。 这 
是 实例 化 Go 语言 里 的 复合 类 型 的 一 种 写法 。 这 里 的 前 者 生成 的 是 一 个 slice 切 片 ， 后 者 生成 的 
是 一 个 struct 结 构 体 。 


gif.GIF 是 一 个 struct 类 型 (参考 4.4 节 ) 。struct 是 一 组 值 或 者 叫 字 段 的 集合 ， 不 同 的 类 型 集合 
在 一 个 struct 可 以 让 我 们 以 一 个 统一 的 单元 进行 处 理 。anim 是 一 个 gif.GIF 类 型 的 struct 变 量 。 

这 种 写法 会 生成 一 个 struct 变 量 ， 并 且 其 内 部 变量 LoopCount 字 段 会 被 设置 为 nframes ; 而 其 
它 的 字段 会 被 设置 为 各 自 类 型 默认 的 零 值 。struct 内 部 的 变量 可 以 以 一 个 点 (.) 来 进行 访问 ， 就 
像 在 最 后 两 个 赋值 语句 中 显 式 地 更 新 了 anim 这 个 struct 的 Delay 和 Image 字 段 。 


lissajous 有 函数 内 部 有 两 层 获 套 的 for 循 环 。 外 层 循 环 会 循环 64 次 ， 每 一 次 都 会 生成 一 个 单独 的 
动画 帧 。 它 生成 了 一 个 包含 两 种 颜色 的 201&201 大 小 的 图 片 ， 白 色 和 黑色 。 所 有 像素 点 都 会 
被 默认 设置 为 其 零 值 (也 就 是 调 色 板 palette 里 的 第 0 个 值 ) ， 这 里 我 们 设置 的 是 白色 。 每 次 外 
层 循环 都 会 生成 一 张 新 图 片 ， 并 将 一 些 像 素 设 置 为 黑色 。 其 结果 会 append 到 之 前 结果 之 后 。 
这 里 我 们 用 到 了 append( 参 考 4.2.1) 内 置 函 数 ， 将 结果 append 到 anim 中 的 帧 列表 末尾 ， 并 设置 
一 个 默认 的 80ms 的 延迟 值 。 循 环 允 Se ee ee TORA 中 ， 并 将 结果 写 入 
到 输出 流 。out 这 个 变量 是 io.Writer 类 型 ， 这 个 类 型 支持 把 输出 结果 写 到 很 多 目标 ， 很 快 我 们 
就 可 以 看 到 例子 


内 层 循环 设置 两 个 偏振 值 。X 轴 偏振 使 用 Sin 函数 。y 轴 偏振 也 是 正弦 波 ， 但 其 相对 X 轴 的 偏振 是 
一 个 0-3 的 随机 值 ， 初 始 偏振 值 是 一 个 零 值 ， 随 着 动画 的 每 一 帧 逐渐 增加 。 循 环 会 一 直 跑 到 X 
轴 完 成 五 次 完整 的 循环 。 每 一 步 它 都 会 调用 SetColorlndex 来 为 (X, y) 点 来 染 黑 色 。 


main 函 数 调 用 lissajous 函 数 ， 用 它 来 向 标准 输出 流 打 印信 息 ， 所 以 下 面 这 个 命令 会 像 图 1.1 中 
产生 一 个 GIF 动画 。 


$ go build gopl.io/chi/lissajous 
$ ./lissajous >out.gif 


练习 1.5 : 修改 前 面 的 Lissajous 程 序 里 的 调 色 板 ， 由 黑色 改 为 绿色 。 我 们 可 以 
用 color. RGBA{@xRR, OxGG, OxBB, oxff} 来 得 到 #RRGGBB 这 个 色 值 ， 三 个 十 六 进 制 的 字符 串 分 


别 代 表 红 、 绿 、 蓝 像素 。 


练习 1.6 : 修改 Lissajous 程 序 ， 修 改 其 调 色 板 来 生成 更 丰富 的 颜色 ， 然 后 修改 SetColorlndex 
的 第 三 个 参数 ， 看 看 显示 结果 吧 。 


1.5. 获取 URL 


对 于 很 多 现代 应 用 来 说 ， 访 问 互联 网 上 的 信息 和 访问 本 地 文件 系统 一 样 重要 。Go 语 言 在 net 这 
个 强大 package 的 帮助 下 提供 了 一 系列 的 package 来 做 这 件 事情 ， 使 用 这 些 包 可 以 更 简单 地 用 
网 络 收发 信息 ， 还 可 以 建立 更 底层 的 网 络 连 接 ， 编 写 服务 器 程序 。 在 这 些 情景 下 ，Go 语 言 原 
生 的 并 发 特性 (在 第 八 章 中 会 介绍 ) 显得 尤其 好 用 。 


为 了 最 简单 地 展示 基于 HTTP 获 取信 息 的 方式 ， 下 面 给 出 一 个 示例 程序 fetch， 这 个 程序 将 获取 
对 应 的 url， 并 将 其 源 文本 打印 出 来 ; 这 个 例子 的 灵感 来 源 于 curl 工 具 〈 译 注 : unix 下 的 一 个 用 
来 发 http 请 求 的 工具 ， 具 体 可 以 man curl) 。 当 然 ，curl 提 供 的 功能 更 为 复杂 丰富 ， 这 里 只 编 
写 最 简单 的 样 例 。 这 个 样 例 之 后 还 会 多 次 被 用 到 。 


gopl.io/ch 1/fetch 


// Fetch prints the content found at a URL. 


package main 


import ( 
mn 
1O LOUE II 
netXhitt 
ost 

) 


func main() { 
for _, url := range os.Args[1i:] { 
resp, err := http.Get(url) 


if err != nil { 
fmt.Fprintf(os.Stderr, "fetch: %v\n", err) 
os.Exit(1) 

} 


b, err := ioutil.ReadAll(resp.Body) 

resp.Body.Close() 

if err != nil { 
fmt.Fprintf(os.Stderr, "fetch: reading %s: %v\n", url, err) 
os.Exit(1) 

} 

fmt.Printf("%s", b) 


这 个 程序 从 两 个 package 中 导入 了 函数 ，net/http 和 io/ioutil 包 ，http.Get 函 数 是 创建 HTTP 请 求 
的 函数 ， 如 果 获 取 过 程 没 有 出 错 ， 那 么 会 在 resp 这 个 结构 体 中 得 到 访问 的 请 求 结 果 。resp 的 
Body 字 段 包 括 一 个 可 读 的 服务 器 响应 流 。ioutil.ReadAll 亟 数 从 response 中 读 取 到 全 部 内 容 ; 


将 其 结果 保存 在 变量 b 中 。resp.Body.Close 关 闭 resp 的 Body 流 ， 防 止 资源 泄露 ，Printf 画 数 全 
将 结果 b 写 出 到 标准 输出 流 中 。 


$ go build gopl.io/chi/fetch 
$ ./fetch http://gopl.io 
<html> 

<head> 


<title>The Go Programming Language</title>title> 


HTTP 请 求 如 果 失 败 了 的 话 ， 会 得 到 下 面 这 样 的 结果 : 


$ ./fetch http://bad.gopl.io 
fetch: Get http://bad.gopl.io: dial tcp: lookup bad.gopl.io: no such host 


译注 : 在 大 天 朝 的 网 络 环境 下 很 容易 重 现 这 种 错误 ， 下 面 是 Windows 下 运行 得 到 的 错误 信 
自 


S > 


$ go run main.go http://gopl.io 

fetch: Get http://gopl.io: dial tcp: lookup gopl.io: getaddrinfow: No such host is known. 
Jooo g 
无 论 哪 种 失败 原因 ， 我 们 的 程序 都 用 了 os.Exit 函 数 来 终止 进程 ， 并 且 返 回 一 个 status 错 误 码 ， 
其 值 为 1。 


练习 1.7 : 函数 调用 io.Copy(dst, src) 会 从 src 中 读 取 内 容 ， 并 将 读 到 的 结果 写 入 到 dst 中 ， 使 用 
这 个 函数 蔡 代 掉 例 子 中 的 ioutil.ReadAll 来 拷贝 响应 结构 体 到 os.Stdout， 避 免 申 请 一 个 缓冲 区 
(例子 中 的 b) 来 存储 。 记 得 处 理 io.Copy 返 回 结 果 中 的 错误 。 


练习 1.8: 修改 fetch 这 个 范例 ， 如 果 输 入 的 url 参数 没有 http:// 前 级 的 话 ， 为 这 个 Ur| 加 上 该 
前 级 。 你 可 能 会 用 到 strings.HasPrefix 这 个 函数 。 


练习 1.9: 修改 fetch 打 印 出 HTTP 协 议 的 状态 码 ， 可 以 从 resp.Status 变 量 得 到 该 状态 码 。 


1.6. 并 发 获取 多 个 URL 


Go 语言 最 有 意思 并 且 最 新 奇 的 特性 就 是 对 并 发 编程 的 支持 。 并 发 编程 是 一 个 大 话题 ， 在 第 八 
章 和 第 九 章 中 会 专门 讲 到 。 这 里 我 们 只 浅 尝 辑 止 地 来 体验 一 下 Go 语言 里 的 goroutine 和 
channel ° 

下 面 的 例子 fetchall， 和 前 面 小 节 的 fetch 程 序 所 要 做 的 工作 基本 一 致 ，fetchall 的 特别 之 处 在 于 
它 会 同时 去 获取 所 有 的 URL， 所 以 这 个 程序 的 总 执行 时 间 不 会 超过 执行 时 间 最 长 的 那 一 个 任 
务 ， 前 面 的 fetch 程 序 执行 时 间 则 是 所 有 任务 执行 时 间 之 和 。fetchall 程 序 只 会 打印 获取 的 内 容 
大 小 和 经 过 的 时 间 ， 不 会 像 之 前 那样 打印 获取 的 内 容 。 


gopl.io/ch1/fetchall 


// Fetchall fetches URLs in parallel and reports their times and sizes. 
package main 


import ( 
Orme 
Nao" 
auTO TOUTI 
net /htepE 
Nos" 
"time" 


func main() { 
start := time.Now() 
ch := make(chan string) 
for _, url := range os.Args[i:] { 
go fetch(url, ch) // start a goroutine 
} 
for range os.Args[1:] { 
fmt.Println(<-ch) // receive from channel ch 


} 
fmt.Printf("%.2fs elapsed\n", time.Since(start).Seconds()) 


func fetch(url string, ch chan<- string) { 
start := time.Now() 
resp, err := http.Get(url) 
if err != nil { 
ch <- fmt.Sprint(err) // send to channel ch 
return 
} 
nbytes, err := i0.Copy(ioutil.Discard, resp.Body) 
resp.Body.Close() // don't leak resources 
if err != nil { 
ch <- fmt.Sprintf("while reading %s: %v", url, err) 
return 
} 
secs := time.Since(start).Seconds() 
ch <- fmt.Sprintf("%.2fs %7d %s", secs, nbytes, url) 


下 面 使 用 fetchall 来 请 求 几 个 地 址 : 


$ go build gopl.io/chi/fetchall 
$ ./fetchall https://golang.org http://gopl.io https://godoc.org 


0.14s 6852 https://godoc.org 
0.16s 7261 https://golang.org 
0.48s 2475 http://gopl.io 


0.48s elapsed 


goroutine 是 一 种 函数 的 并 发 执行 方式 ， 而 channel 是 用 来 在 goroutine 之 间 进 行 参数 传递 。 
main BAA Y wie 2 而 go function 则 表示 创建 一 个 新 的 goroutine， 并 在 
这 个 新 的 goroutine 中 执行 这 个 函数 。 


main 元 数 中 用 make 哆 数 创建 了 一 个 传递 string 类 型 参数 的 channel， 对 每 一 个 命令 行 参数 ， 我 
gp 个 关键 字 来 创建 一 个 goroutine， 并 且 让 函数 在 这 个 goroutine 异 步 执 行 http.Get 方 
法 。 这 个 程序 里 的 io.Copy 会 把 响应 的 Body 内 容 拷贝 到 ioutil.Discard 输 出 流 中 (译注 : 
这 个 变量 看 作 一 个 垃圾 桶 ， 可 以 向 里 面 写 一 些 不 需要 的 数据 ) ， 因 为 我 们 需要 这 个 方法 返 

的 字 节 数 ， 但 是 又 不 想 要 其 内 容 。 每 当 请 求 返 回 内 容 时 ， E A 
ATS FAB > main Bk E ig FH = Morse # RAE FH 47 PP channel E 3k SF 4 o 


当 一 个 goroutine 尝 试 在 一 个 channel 上 做 send 或 者 receive 操 作 时 ， 这 个 goroutine 会 阻塞 在 调 
用 处 ， 直 到 另 一 个 goroutine 往 这 个 channel 里 写 入 、 或 者 接收 值 ， PA Sanne: 会 继续 
执行 channel 操 作 之 后 的 逻辑 。 在 这 个 例子 中 ， Ih hannel = = 
送 一 个 值 (ch <- expression)， 主 函数 负责 接收 这 些 值 (<-ch)。 这 个 程序 中 我 们 用 main 函 数 来 接 
收 所 有 fetch 部 数 传 回 的 字符 串 ， 可 以 避免 在 goroutine 异 步 执行 还 没有 完成 时 main 兄 数 提前 退 
出 。 


练习 1.10 : 找 一 个 数据 量 比 较 大 的 网 站 ， 用 本 小 节 We ， 对 每 个 
URL 执 行 两 遍 请 求 ， 查 看 两 次 时 间 是 否 有 较 大 的 差别 ， 并 且 每 次 获取 到 的 响应 内 容 是 否 一 
致 ， 修 改 本 节 中 的 程序 ， 将 响应 结果 输出 ， ee 比 。 


练习 1.11 : 在 fatchall 中 尝试 使 用 长 一 些 的 参数 列表 ， 比 如 使 用 在 alexa.com 的 上 百 万 网 站 里 
排名 靠 前 的 。 如 果 一 个 网 站 没有 回应 ， 程 序 将 采取 怎样 的 行为 ? (Section8.9 描述 了 在 这 种 
情况 下 的 应 对 机 制 ) 。 


1.7. Web 服 务 


Go 语言 的 内 置 库 使 得 写 一 个 类 似 fetch 的 web 服 务 器 变 得 异常 地 简单 。 在 本 节 中 ， 我 们 会 展示 
一 个 微型 服务 器 ， 这 个 服务 器 的 功能 是 返回 当前 meas 的 URL。 比 如 用 户 访 问 的 是 
http://localhost:8000/hello ， 那 么 响应 是 URL.Path = "hello" ° 


gopl.io/ch1/server1 


1 ps 


// Serveri is a minimal "echo" server 


package main 


import ( 
fn 
loge 
Mnet/ Init ie 
) 


func main() { 
http.HandleFunc("/", handler) // each request calls handler 
log.Fatal(http.ListenAndServe("localhost:8000", nil)) 


} 


// handler echoes the Path component of the request URL r. 
func handler(w http.ResponseWriter, r *http.Request) { 
fmt.Fprintf(w, "URL.Path = %q\n", r.URL.Path) 


} 


我 们 只 用 了 八 九 行 代码 就 实现 了 一 个 Web 服 务 程序 ， 这 都 是 多 亏 了 标准 库 里 的 方法 已 经 帮 有 我 
们 完成 了 大 量 工作 。main 有 函数 将 所 有 发 送 到 /路 径 下 的 请 求 和 handler 有 函数 关联 起 来 ，/ 开 头 的 
请 求 其 实 就 是 所 有 发 送 到 当前 站 点 上 的 请 求 ， 服 务 监 听 8000 端 口 。 发 送 到 这 个 服务 的 “请 求 "是 
一 个 http.Request 类 型 的 对 象 ， 这 个 对 象 中 包含 了 请 求 中 的 一 系列 相关 字段 ， 其 中 就 包括 我 们 
需要 的 URL。 当 请 求 到 达 服 务 器 时 ， 这 个 请 求 会 被 传 给 handler 函 数 来 处 理 ， 这 个 函数 会 

将 /hello 这 个 路 径 从 请 求 的 URL 中 解析 出 来 ， 然 后 把 其 发 送 到 响应 中 ， 这 里 我 们 用 的 是 标准 输 
出 流 的 fmt.Fprintf。Web 服 务 会 在 第 7.7 节 中 做 更 详细 的 益 述 。 


让 我 们 在 后 台 运 行 这 个 服务 程序 。 如 果 你 的 操作 系统 是 Mac OS X 或 者 Linux， 那 么 在 运行 命 
令 的 末尾 加 上 一 个 & 符 号 ， 即 可 让 程序 简单 地 跑 在 后 台 ，windows 下 可 以 在 另外 一 个 命令 行 窗 
口 去 运行 这 个 程序 。 


$ go run src/gopl.io/chi/serveri/main.go & 


现在 可 以 通过 命令 行 来 发 送 客 户 端 请 求 了 : 


$ go build gopl.io/chi/fetch 

$ ./fetch http://localhost :8000 
URL.Path = "/" 

$ ./fetch http://localhost :8000/help 
URL.Path = "/help" 


还 可 以 直接 在 浏览 器 里 访问 这 个 URL， 然 后 得 到 返回 结果 ， 如 图 1.2 : 


localhost:8000 x 
£~ C fi localhost:8000 


URL.Path = “/" 


Figure 1.2. A response from the echo server. 


在 这 个 服务 的 基础 上 党 加 特性 是 很 容易 的 。 一 种 比较 实用 的 修改 是 为 访问 的 Ur| 添 加 某 种 状 
态 。 比 如 ， 下 面 这 个 版 本 输出 了 同样 的 内 容 ， 但 是 会 对 请 求 的 次 数 进行 计算 ; 对 URL 的 请 求 
结果 会 包含 各 种 URL 被 访问 的 总 次 数 ， 直 接 对 /count 这 个 URL 的 访问 要 除外 。 


gopl.io/ch1/server2 


// Server2 is a minimal "echo" and counter server. 


package main 


import ( 
Dimi! 
"log" 
"net/http" 
"sync" 

) 


var mu sync.Mutex 
var count int 


func main() { 
http.HandleFunc("/", handler) 
http.HandleFunc("/count", counter) 
log.Fatal(http.ListenAndServe("localhost:8000", nil)) 


// handler echoes the Path component of the requested URL. 
func handler(w http.ResponseWriter, r *http.Request) { 
mu.Lock() 
count++ 
mu.Unlock() 
fmt.Fprintf(w, "URL.Path = %q\n", r.URL.Path) 


// counter echoes the number of calls so far. 

func counter(w http.ResponseWriter, r *http.Request) { 
mu.Lock() 
fmt.Fprintf(w, "Count %d\n", count) 
mu.Unlock() 


这 个 服务 器 有 两 个 请 求 处 理 函 数 ， 根 据 请 求 的 url 不 同 会 调用 不 同 的 函数 : 对 /count 这 个 ur 的 
请 求 会 调用 到 count 这 个 函数 ， 其 它 的 Url 都 会 调用 默认 的 处 理 函 数 。 如 果 你 的 请 求 pattern 是 
以 /结尾 ， 那 么 所 有 以 该 ur| 为 前 缀 的 Url 都 会 被 这 条 规则 匹配 。 在 这 些 代码 的 背后 ， 服 务 器 每 一 
次 接收 请 求 处 理 时 都 会 另 起 一 个 goroutine， 这 样 服务 器 就 可 以 同一 时 间 处 理 多 个 请 求 。 然 而 
在 并 发 情况 下 ， 假 如 丨 的 有 两 个 请 求 同 一 时 刻 去 更 新 count， 那 么 这 个 值 可 能 并 不 会 被 正确 地 
增加 ; 这 个 程序 可 能 会 引发 一 个 严重 的 bug : 竞 态 条 件 (参见 9.1) 。 为 了 避免 这 个 问题 ， 我 
们 必须 保证 每 次 修改 变量 的 最 多 只 能 有 一 个 goroutine， 这 也 就 是 代码 里 的 mu.Lock() 和 
mu.Unlock() 调 用 将 修改 count 的 所 有 行为 包 在 中 间 的 目的 。 第 九 章 中 我 们 会 进一步 讲解 共享 变 
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下 面 是 一 个 更 为 丰富 的 例子 ，handler 函 数 会 把 请 求 的 http 头 和 请 求 的 form 数 据 都 打印 出 来 ， 
这 样 可 以 使 检查 和 调试 这 个 服务 更 为 方便 : 


gopl.io/ch1/server3 


// handler echoes the HTTP request 
func handler(w http.ResponseWriter, r *http.Request) { 
fmt.Fprintf(w, "%s %s %s\n", r.Method, r.URL, r.Proto) 
for k, v := range r.Header { 
fmt.Fprintf(w, "Header[%q] = %q\n", k, v) 
} 
fmt.Fprintf(w, "Host = %q\n", r.Host) 
fmt.Forintf(w, "RemoteAddr = %q\n", r.RemoteAddr ) 


if err := r.ParseForm(); err != nil { 
log.Print(err) 
} 
for k, v := range r.Form { 
fmt.Fprintf(w, "Form[%q] = %q\n", k, v) 
} 


我 们 用 http.Request 这 个 struct 里 的 字段 来 输出 下 面 这 样 的 内 容 : 


GET /?q=query HTTP/1.1 
Header ["Accept-Encoding"] = ["gzip, deflate, sdch"] Header["Accept-Language"] = ["en-US,e 
Header["Connection"] = ["keep-alive"] 


Header["Accept"] = ["text/html, application/xhtml+xml, application/xml;..."] Header["User-A 
RemoteAddr = "127.0.0.1:59911" 


Form["q"] = ["query"] 





可 以 看 到 这 里 的 ParseForm 被 齿 套 在 了 if 语句 中 。Go 语 言 允 许 这 样 的 一 1 ee i 
循环 的 变量 声明 出 现在 if 语 句 的 最 前 面 ， 这 一 点 对 错误 处 理 很 有 用 处 。 我 们 还 可 以 像 下 面 这 
写 (当然 看 起 来 就 长 了 一 些 ) 


err := r.ParseForm() 
if err != nil { 
log.Print(err) 


用 if 和 ParseForm 结 合 可 以 让 代码 更 加 简单 ， 并 且 可 以 限制 err 这 个 变量 的 作用 域 ， 做 是 很 
不 错 的 。 我 们 会 在 2.7 节 中 讲解 作用 域 。 


在 这 些 程序 中 ， 我 们 看 到 了 很 多 不 同 的 类 型 被 输出 到 标准 输出 流 中 。 比 如 前 面 的 fetch 程 序 ， 
把 HTTP 的 响应 数据 拷贝 到 了 os.Stdout ，lissajous 程 序 里 我 们 输出 的 是 一 个 文件 。fetchall 程 序 
则 完全 忽略 到 了 HTTP 的 响应 Body， 只 是 计算 了 一 下 响应 Body 的 大 小 ， 这 个 程序 中 把 响应 
Body 拷 贝 到 了 ioutil.Discard。 在 本 节 的 web 服 务 器 程序 中 则 是 用 fmt.Fprintf 直 接 写 到 了 
http.ResponseWriter 中 。 


三 种 具体 的 A > 他们 都 实现 一 个 共同 的 接口 ， 即 当 它们 被 调用 需要 一 
个 标准 流 输出 时 都 可 以 满足 。 这 个 接口 叫 作 io.Writer， 在 7.1 节 中 会 详细 讨论 。 


Go 语言 的 接口 机 制 会 在 第 7 章 中 讲解 ， 为 了 在 这 里 简单 说 明 接 口 能 做 什么 ， 让 我 们 简单 地 将 这 
里 的 web 服 务 器 和 之 前 写 的 lissajous 函 数 结合 起 来 ， 这 样 GIF 动 画 可 以 被 写 到 HTTP 的 客户 
端 ， 而 不 是 之 前 的 标准 输出 流 。 只 要 在 Web 服 务 器 的 代码 里 加 入 下 面 这 几 行 。 


handler := func(w http.Responsewriter, r *http.Request) { 
lissajous(w) 

} 

http.HandleFunc("/", handler) 


或 者 另 一 种 等 价 形式 : 


http.HandleFunc("/", func(w http.Responsewriter, r *http.Request) { 
lissajous(w) 


}) 
HandleFunc 42% -AAAA HAHN F Oi? HHA-PAEEPANTCLNES HH o 
这 些 内 容 我 们 会 在 5.6 节 中 讲解 。 


做 完 这 些 修改 之 后 ， 在 浏览 器 里 访问 http://localhost:8000 。 每 次 你 载 入 这 个 页 面 都 可 以 看 到 
一 个 像 图 1.3 那 样 的 动画 。 
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Figure 1.3. Animated Lissajous figures in a browser. 


练习 1.12: 修改 Lissajour 服 务 ， 从 URL 读 取 变 量 ， 比 如 你 可 以 访问 http://localhost:8000/? 
cycles=20 这 个 URL， 这 样 访问 可 以 将 程序 里 的 cycles 默 认 的 5 修改 为 20。 字 符 串 转换 为 数字 
可 以 调用 strconv.Atoi 函 数 。 你 可 以 在 godoc 里 查看 strconv.Atoi 的 详细 说 明 。 


Web 服 务 
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1.8. 本 章 要 点 


本 章 对 Go 语言 做 了 一 些 介 绍 ，Go 语 言 很 多 方面 在 有 限 的 篇 幅 中 无 法 履 盖 到 。 本 节 会 把 没有 讲 


2 


到 的 内 容 也 做 一 些 简 单 的 介绍 ， 这 样 读 者 在 读 到 完整 的 内 容 之 前 ， 可 以 有 个 简单 的 印象 。 


控制 流 : 在 本 章 我 们 只 介绍 了 if 控制 和 for， 但 是 没有 提 到 switch 多 路 选择 。 这 里 是 一 个 简单 的 
switch 的 例子 : 


switch coinflip() { 
case "heads": 
heads++ 
case: “taailis: 
tails++ 
default: 
fmt.Println("landed on edge!") 


在 翻转 硬币 的 时 候 ， 例 子 里 的 coinflip 函 数 返回 几 种 不 同 的 结果 ， 每 一 个 case 都 会 对 应 一 个 返 
回 结 果 ， 这 里 需要 注意 ，Go 语 言 并 不 需要 显 式 地 在 每 一 个 case 后 写 break， 语 言 默认 执行 完 
case 后 的 逻辑 语句 会 自动 退出 。 当 然 了 ， 如 果 你 想 要 相 令 的 几 个 case 都 执行 同一 逻辑 的 话 ， 
需要 自己 显 式 地 写 上 一 个 fallthrough 语 多 来 覆盖 这 种 默认 行为 。 不 过 fallthrough 语 名 在 一 般 的 
程序 中 很 少 用 到 。 


Go 语言 里 的 switch 还 可 以 不 带 操 作对 象 (译注 : switch 不 带 操 作对 象 时 默认 用 true 值 代替， 然 
后 将 每 个 case 的 表达 式 和 true 值 进行 比较 ) ; 可 以 直接 罗列 多 种 条 件 ， 像 其 它 语言 里 面 的 多 个 
if else 一 样 ， 下 面 是 一 个 例子 : 


func Signum(x int) int { 
switch { 
casey x. 0 
tse ela) EE 
default: 
return © 
Case xX <10: 
return 下 


这 种 形式 叫做 无 tag switch(tagless switch) ; 这 和 switch true 是 等 价 的 。 


像 for 和 if 控制 语句 一 样 ，switch 也 可 以 紧 跟 一 个 简短 的 变量 声明 ， 一 个 自 增 表 达 式 、 赋 值 语 
句 ， 或 者 一 个 函数 调用 (译注 : 比 其 它 语言 丰富 )。 


break 和 continue 语 句 会 改变 控制 流 。 和 其 它 语言 中 的 break 和 continue 一 样 ，break 会 中 断 当 
前 的 循环 ， 并 开始 执行 循环 之 后 的 内 容 ， 而 continue 会 中 跳 过 当前 循环 ， 并 开始 执行 下 一 次 循 
环 。 这 两 个 语句 除了 可 以 控制 for 循 环 ， 还 可 以 用 来 控制 Switch 和 select 语 名 (之 后 会 讲 到 )， 在 
1.3 节 中 我 们 看 到 ，continue 会 跳 过 内 层 的 循环 ， 如 果 我 们 想 跳 过 的 是 更 外 层 的 循环 的 话 ， 我 
们 可 以 在 相应 的 位 置 加 上 label， 这 样 break 和 continue 就 可 以 根据 我 们 的 想法 来 continue 和 
break 任 意 循环 。 这 看 起 来 甚至 有 点 像 goto 语 名 的 作用 了 。 当 然 ， 一 般 程序 员 也 不 会 用 到 这 种 
操作 。 这 两 种 行为 更 多 地 被 用 到 机 器 生成 的 代码 中 。 


命名 类 型 : 类 型 声明 使 得 我 们 可 以 很 方便 地 给 一 个 特殊 类 型 一 个 名 字 。 因 为 struct 类 型 声明 通 
常 非常 地 长 ， 所 以 我 们 总 要 给 这 种 struct 取 一 个 名 字 。 本 章 中 就 有 这 样 一 个 例子 ， 二 维 点 类 
型 : 


type Point struct { 
X, Y int 
} 


var p Point 


类 型 声明 和 命名 类 型 会 在 第 二 章 中 介绍 。 


指针 : Go 语言 提供 了 指针 。 指 针 是 一 种 直接 存储 了 变量 的 内 存 地 址 的 数据 类 型 。 在 其 它 语言 
中 ， 比 如 C 语 言 ， 指 针 操 作 是 完全 不 受 约束 的 。 在 另外 一 些 语言 中 ， 指 针 一般 被 处 理 为 “ 引 
用 ”， 除了 到 处 传递 这 些 指针 之 外 ， 并 不 能 对 这 些 指 针 做 太 多 事情 。Go 语 言 在 这 两 种 范围 中 取 
了 一 种 平衡 。 指 针 是 可 见 的 内 存 地 址 ，& 操 作 符 可 以 返回 一 个 变量 的 内 存 地 址 ， 并 且 * 操 作 符 
可 以 获取 指针 指向 的 变量 内 容 ， 但 是 在 Go 语言 里 没有 指针 运算 ， 也 就 是 不 能 像 c 语 言 里 可 以 对 
指针 进行 加 或 减 操作 。 我 们 会 在 2.3.2 中 进行 详细 介绍 。 


方法 和 接口 : 方法 是 和 命名 类 型 关联 的 一 类 函数 。Go 语 言 里 比较 特殊 的 是 方法 可 以 被 关联 到 
任意 一 种 命名 类 型 。 在 第 六 章 我 们 会 详细 地 讲 方法 。 接 口 是 一 种 抽象 类 型 ， 这 种 类 型 可 以 让 
我 们 以 同样 的 方式 来 处 理 不 同 的 固有 类 型 ， 不 用 关心 它们 的 具体 实现 ， 而 只 需要 关注 它们 提 
供 的 方法 。 第 七 章 中 会 详细 说 明 这 些 内 容 。 


包 (packages) : Go 语言 提供 了 一 些 很 好 用 的 package， 并 且 这 些 package 是 可 以 扩展 的 。 
Go 语言 社区 已 经 创造 并 且 分 享 了 很 多 很 多 。 所 以 Go 语言 编程 大 多 数 情况 下 就 是 用 已 有 的 
package 来 写 我 们 自己 的 代码 。 通 过 这 本 书 ， 我 们 会 讲解 一 些 重 要 的 标准 库 内 的 package， 但 
是 还 是 有 很 多 限于 篇 幅 没 有 去 说 明 ， 因 为 我 们 没 法 在 这 样 的 厚度 的 书 里 去 做 一 部 代码 大 全 。 


在 你 开始 写 一 个 新 程序 之 前 ， 最 好 先 去 检查 一 下 是 不 是 已 经 有 了 现成 的 库 可 以 帮助 你 更 高 效 
地 完成 这 件 事 情 。 你 可 以 在 https://golang.org/pkg 和 https://godoc.org 中 找到 标准 库 和 社区 
写 的 package。godoc 这 个 工具 可 以 让 你 直接 在 本 地 命令 行 阅读 标准 库 的 文档 。 比 如 下 面 这 个 
例子 。 


$ go doc http.ListenAndServe 

package http // import "net/http" 

func ListenAndServe(addr string, handler Handler) error 
ListenAndServe listens on the TCP network address addr and then 


calls Serve with handler to handle requests on incoming connections. 


注释 : 我 们 之 前 已 经 提 到 过 了 在 源 文 件 的 开头 写 的 注释 是 这 个 源 文件 的 文档 。 在 每 一 个 函数 
之 前 写 一 个 说 明 函 数 行为 的 注释 也 是 一 个 好 习惯 。 这 些 惯例 很 重要 ， 因 为 这 些 内 容 会 被 像 
godoc 这 样 的 工具 检测 到 ， 并 且 在 执行 命令 时 显示 这 些 注释 。 具 体 可 以 参考 10.7.4。 

多 行 注 释 可 以 用 /* ... */ 来 包 衰 ， 和 其 它 大 多 数 语言 一 样 。 在 文件 一 开头 的 注释 一 般 都 是 
这 种 形式 ， 或 者 一 大 段 的 解释 性 的 注释 文字 也 会 被 这 符号 包 住 ， 来 避免 每 一 行 都 需要 加 //。 在 
注释 中 1/ 入 是 没什么 意义 的 ， 所 以 不 要 在 注释 中 再 虞 入 注释 。 


第 二 章 程序 结构 


Go 语言 和 其 他 编程 语言 一 样 ， 一 个 大 的 程序 是 由 很 多 小 的 基础 构件 组 成 的 。 变 量 保存 值 ， 简 
单 的 加 法 和 减法 运算 被 组 合成 较 复杂 的 表达 式 。 基 础 类 型 被 聚合 为 数组 或 结构 体 等 更 复杂 的 
数据 结构 。 然 后 使 用 if 和 for 之 类 的 控制 语句 来 组 织 和 控制 表达 式 的 执行 流程 。 然 后 多 个 语句 被 


组 织 到 一 个 个 函数 中 ， 以 便 代 码 的 隔离 和 复 用 。 郊 数 以 源 文件 和 和 包 的 方式 被 组 织 。 
我 们 已 经 在 前 面 章节 的 例子 中 看 到 了 很 多 例子 。 在 本 章 中 ， 我 们 将 深入 讨论 Go 程序 基础 结构 
方面 的 一 些 细节 。 每 个 示例 程序 都 是 刻意 写 的 简单 ， 这 样 我 们 可 以 减少 复杂 的 算法 或 数据 结 
构 等 不 相关 的 问题 带 来 的 干扰 ， 从 而 可 以 专注 于 Go 语言 本 身 的 学 习 。 


命名 


0 语言 中 的 函数 名 、 变 量 名 、 常 量 名 、 类 型 名 、 语 名 标号 和 包 名 等 所 有 的 命名 ， 都 遵循 一 个 
eons 名 规则 : 一 个 名 字 必 须 以 一 个 字母 (Unicode #4) 或 下 划 线 开头 ， 后 面 可 以 跟 任 意 
数量 的 字母 、 数 字 或 下 划 线 。 大 写字 母 和 小 写字 母 是 不 同 的 : heapSort 和 Heapsort 是 两 个 不 
同 的 名 字 。 


0 语言 中 类 似 if 和 switch 的 关键 字 有 25 个 ; 关键 字 不 能 用 于 自 定义 名 字 ， 只 能 在 特定 语法 结构 
oe s 


break default func interface select 
case defer go map struct 
chan else goto package switch 
const fallthrough if range type 
continue for import return var 


此 外 ， 还 有 大 约 30 多 个 预定 义 的 名 字 ， 比 如 int 和 true 等 ， 主 要 对 应 内 建 的 常量 、 类 型 和 函数 。 


内 建 常 量 : true false iota nil 


内 建 类 型 ; int int8 int16 int32 int64 
uint uint8 uint16 uint32 uint64 uintptr 
float32 float64 complex128 complex64 
bool byte rune string error 


内 建 函 数 : make len cap new append copy close delete 
complex real imag 
panic recover 


这 些 内 部 预先 定义 的 名 字 并 不 是 关键 字 ， 你 可 以 再 定义 中 重新 使 用 它们 。 在 一 些 特殊 的 场景 
中 重新 定义 它们 也 是 有 意义 的 ， 但 是 也 要 注意 避免 过 度 而 引起 语义 混乱 。 


st 字 是 在 函数 内 部 定义 ， 那 么 它 的 就 只 在 函数 内 部 有 效 。 如 果 是 在 函数 外 部 定义 ， 
hh 么 将 在 当前 包 的 所 有 文件 中 都 可 以 访问 。 名 字 的 开头 字母 的 大 小 写 决 定 了 名 字 在 包 外 的 可 
见 性 。 如 果 一 个 名 字 是 大 写字 母 开 头 的 (译注 : 必须 是 在 函数 外 部 定义 的 包 级 名 字 ; ARH 
数 名 本 身 也 是 包 级 名 字 ) ， 那 么 它 将 是 导出 的 ， 也 就 是 说 可 以 被 外 部 的 包 访 问 ， 例 如 fmt 包 的 
Printf 骂 数 就 是 导出 的 ， 可 以 在 fmt 包 外 部 访问 。 包 本 身 的 名 字 一 般 总 是 用 小 写字 母 。 


名 字 的 长 度 没有 逻辑 限制 ， 但 是 Go 语言 的 风格 是 尽量 使 用 短小 的 名 字 ， 对 于 局 部 变量 尤其 是 
这 样 ; 你 会 经 常 看 到 i 之 类 的 短 名 字 ， 而 不 是 宛 长 的 theLooplndex 命 名 。 通 常 来 说 ， 如 果 一 个 
名 字 的 作用 域 比较 大 ， 生 命 周 期 也 比较 长 ， 那 么 用 长 的 名 字 将 会 更 有 意义 。 


在 习惯 上 ，Go 语 言 程 序 员 推荐 使 用 驼峰 式 命名 ， 当 名 字 有 几 个 单词 组 成 的 时 优先 使 用 大 小 写 
分 隔 ， 而 不 是 优先 用 下 划 线 分 隔 。 因 此 ， 在 标准 库 有 QuoteRuneToASCII 和 parseRequestLine 
这 样 的 函数 命名 ， 但 是 一 般 不 会 用 quote _rune to ASCIl 和 parse_request line 这 样 的 命名 。 
而 像 ASCIll 和 HTML 这 样 的 缩 略 词 则 避免 使 用 大 小 写 混合 的 写法 ， 它 们 可 能 被 称 为 
htmlEscape、HTMLEscape 或 escapeHTML ， 但 不 会 是 escapeHtml。 


声明 


声明 语句 定义 了 程序 的 各 种 实体 对 象 以 及 部 分 或 全 ae 。 Go 语言 主要 有 四 种 类 型 的 声明 
语句 : Varf、const、type 和 func， 分 别 对 应 变量 、 常 量 、 类 型 和 函数 实体 对 象 的 声明 。 这 一 
我 们 重点 讨论 变量 和 类 型 的 声明 ， 第 三 章 将 讨论 常量 的 声 oe Seer 


一 个 Go 语言 编写 的 程序 对 应 一 个 或 多 个 以 .go 为 文件 后 级 名 的 源 文件 中 。 每 人 nee ay Æ 
明 语句 开始 ， 说 明 该 源 文件 是 属于 哪个 包 。 包 声明 语 nd 是 import 语 句 导 入 依赖 的 其 它 包 ， 
然后 是 包 一 级 的 类 型 、 变 量 、 常 量 、 函 数 的 声明 语句 ， 包 一 级 的 各 种 类 型 的 声明 语句 的 顺序 
无 关 紧 要 (译注 : 函数 内 部 的 名 字 则 必须 先 声 oer 。 例 如， 下 面 的 例子 中 声明 


了 一 个 常量 、 一 个 函数 和 两 个 变量 : 
gopl.io/ch2/boiling 


// Boiling prints the boiling point of water. 
package main 


import "fmt" 
const boilingF = 212.0 


func main() { 
var f = boilingF 
van e =>(h as O2)) ”5/9 
fmt.Printf("boiling point = %g°F or %g°C\n", f, c) 
// Output: 
// boiling point = 212°F or 100°C 


其 中 常量 boilingF 是 在 包 一 级 范围 声明 语句 声明 的 ， 然 后 fc 两 个 变量 是 在 main 兄 数 内 部 声明 
的 声明 语句 声明 的 。 在 包 一 级 声明 语句 声明 的 名 字 可 在 整个 包 对 应 的 每 个 源 文件 中 访问 ， 而 
不 是 仅仅 在 其 声明 语句 所 在 的 源 文件 中 访问 。 相 比 之 下 ， 局 部 声明 的 名 字 就 只 能 在 函数 内 部 
很 小 的 范围 被 访问 。 


一 个 函数 的 声明 由 一 个 函数 名 字 、 参 数列 表 〈 由 函数 的 调用 者 提供 参数 变量 的 具体 值 ) 、 一 

个 可 选 的 返回 值 列 表 和 包含 函数 定义 的 函数 体 组 成 。 如 果 函 数 没 有 返回 值 ， 那 么 返回 值 列表 

是 省 略 的 。 执 行 函数 从 函数 的 第 一 个 语句 开始 ， 依 次 顺序 执行 直到 遇 到 renturn 返 回 语句 ， 如 
果 没 有 返回 语 多 则 是 执行 到 函数 末尾 ， 然 后 返回 到 函数 调用 者 。 


我 们 已 经 看 到 过 很 多 函数 声明 和 函数 调用 的 例子 了 ， 在 第 五 章 将 深入 讨论 函数 的 相关 细节 ， 
这 里 只 简单 解释 下 。 下 面 的 fToC 部 数 封 装 了 温度 转换 的 处 理 逻 辑 ， 这 样 它 只 需要 被 定义 一 
次 ， 就 可 以 在 多 个 地 方 多 次 被 使 用 。 在 这 个 例子 中 ，main 兄 数 就 调用 了 两 次 fToC 元 数 ， 分 别 
是 使 用 在 局 部 定义 的 两 个 常量 作为 调用 函数 的 参数 。 


gopl.io/ch2/ftoc 


// Ftoc prints two Fahrenheit-to-Celsius conversions. 
package main 


import "fmt" 


func main() { 
const freezingF, boilingF = 32.0, 212.0 
fmt.Printf("%g°F = %g°C\n", freezingF, fToC(freezingF)) // "32°F = 0°C" 
fmt.Printf("%g°F = %g°C\n", boilingF, fToC(boilingF) ) if ple es hooey 


func fToC(f float64) floaté4 { 
recurnmn (AF 32 = tse Hf ©) 


2.3. ap 量 


Var 声 明 语句 可 以 创建 一 个 特定 类 型 的 变量 ， 然 后 给 变量 附加 一 个 名 字 ， 并 且 设 置 变量 的 初始 
值 。 变 量 声明 的 一 般 语 法 如 下 : 


其 中 “类 型 "或 “= 表达 式 "两 个 部 分 可 以 省 略 其 中 的 一 个 。 如 果 省 略 的 是 类 型 信息 ， 那 么 将 根据 
初始 化 表达 式 来 推导 变量 的 类 型 信息 。 如 果 初 始 化 表达 式 被 省 略 ， 那 么 将 用 零 值 初始 化 该 变 
Eo 数值 类 型 变量 对 应 的 零 值 是 0， 布 尔 类 型 变量 对 应 的 零 值 是 false， 字 符 串 类 型 对 应 的 零 
值 是 空 字 符 串 ， 接 口 或 引用 类 型 (包括 slice、map、chan 和 函数 ) 变量 对 应 的 零 值 是 nil。 数 
组 或 结构 体 等 聚合 类 型 对 应 的 零 值 是 每 个 元 素 或 字段 都 是 对 应 该 类 型 的 零 值 。 


零 值 初始 化 机 制 可 以 确保 每 个 声明 的 变量 总 是 有 一 个 良好 定义 的 值 ， 因 此 在 Go 语言 中 不 存在 
未 初始 化 的 变量 。 这 个 特性 可 以 简化 很 多 代码 ， 而 且 可 以 在 没有 增加 额外 工作 的 前 提 下 确保 
边界 条 件 下 的 合理 行为 。 例 如 : 


var s string 
fmt.Println(s) // "" 


这 段 代 码 将 打印 一 个 空 字符 串 ， 而 不 是 导致 错误 或 产生 不 可 预知 的 行为 。Go 语 言 程序 员 应 该 
证 一些 聚合 类 型 的 零 值 也 具有 意义 ， 这 样 可 以 保证 不 管 任何 类 型 的 变量 总 是 有 一 个 合理 有 效 
的 零 值 状态 。 


也 可 以 在 一 个 声明 语句 中 同时 声明 一 组 变量 ， 或 用 一 组 初始 化 表达 式 声 明 并 初始 化 一 组 变 
量 。 如 果 省 略 每 个 变量 的 类 型 ， 将 可 以 声明 多 个 类 型 不 同 的 变量 (类 型 由 初始 化 表达 式 推 
=) 


var i, j, k int Mie sling, alle, Sige 
van bt — thle 2-3, Tour // bool moat SA sstming 


初始 化 表达 式 可 以 是 字面 量 或 任意 的 表达 式 。 在 包 级 别 声明 的 变量 会 在 main 入 口 函数 执行 前 
完成 初始 化 (§2.6.2) ， 局 部 变量 将 在 声明 语句 被 执行 到 的 时 候 完 成 初始 化 。 


一 组 变量 也 可 以 通过 调用 一 个 函数 ， 由 函数 返回 的 多 个 返回 值 初始 化 : 


var f, err = os.Open(name) // os.Open returns a file and an error 


2.3.1. 简短 变量 声明 


在 函数 内 部 ， 有 一 种 称 为 简短 变量 声明 语句 的 形式 可 用 于 声明 和 初始 化 局 部 变量 。 它 以 “名 字 
:= 表达 式 ” 形 式 声明 变量 ， 变 量 的 类 型 根据 表达 式 来 自动 推导 。 下 面 是 lissajous 兄 数 中 的 三 个 
简短 变量 声明 语句 (8S1.4 ) 


anim := gif.GIF{LoopCount: nframes} 
freq := rand.Float64() * 3.0 
ie pe (0)510, 


因为 简洁 和 灵活 的 特点 ， 简 短 变 量 声 明 被 广泛 用 于 大 部 分 的 局 部 变量 的 声明 和 初始 化 。var 形 
式 的 声明 语句 往往 是 用 于 需要 显 式 指定 变量 类 型 地 方 ， 或 者 因为 变量 稍 后 会 被 重新 赋值 而 初 
始 值 无 关 紧 要 的 地 方 。 


i := 100 // an int 
var boiling float64 = 100 // a float64 
var names []string 

var err error 

var p Point 


和 var 形 式 声明 语 名 一样， 简短 变量 声明 语句 也 可 以 用 来 声明 和 初始 化 一 组 变量 : 


但 是 这 种 同时 声明 多 个 变量 的 方式 应 该 限制 只 在 可 以 提高 代码 可 读 性 的 地 方 使 用 ， 比 如 for 语 
句 的 循环 的 初始 化 语句 部 分 


请 记 住 :=” 是 一 个 变量 声明 语句 ， 而 “=' 是 一 个 变量 赋值 操作 。 eae 淆 多 个 变量 的 声明 和 元 
组 的 多 重 赋值 (§2.4.1) ， 后 者 是 将 右边 各 个 的 表达 式 值 赋值 给 左边 对 应 位 置 的 各 个 变量 : 


i, j=j, i// 交换 i 和 j 


和 普通 var 形式 的 变量 声明 语句 一 样 ， 简 短 变量 声明 语句 也 可 以 用 函数 的 返回 值 来 声明 和 初始 
化 变量 ， 像 下 面 的 0S.Open 兄 数 调 用 将 返回 两 个 值 : 


f, err := os.Open(name) 
if err != nil { 
return err 


} 
LL ae USC. fe 
f.Close() 


这 里 有 一 个 比较 微妙 的 地 方 : 简短 变量 声明 左边 的 变量 可 能 并 不 是 全 部 都 是 刚刚 声明 的 。 如 
果 有 一 些 已 经 在 相同 的 词法 域 声 明 过 了 (§2.7) ， 那 么 简短 变量 声明 语句 对 这 些 已 经 声明 过 
的 变量 就 只 有 赋值 行为 了 。 


a 
= 


在 下 面 的 代码 中 ， 第 一 个 语句 声明 了 in 和 err 两 个 变量 。 在 第 二 个 语句 只 声明 了 out 一 个 变量 ， 
然后 对 已 经 声明 的 err 进 行 了 赋值 操作 。 


in, err := os.Open(infile) 
df 
out, err := os.Create(outfile) 


简短 变量 声明 语句 中 必须 至 少 要 声明 一 个 新 的 变量 ， 下 面 的 代码 将 不 能 编译 通过 : 


f, err := os.Open(infile) 


f, err := os.Create(outfile) // compile error: no new variables 


解决 的 方法 是 第 二 个 简短 变量 声明 语句 改 用 普通 的 多 重 赋值 语言 。 


简短 变量 声明 语句 只 有 对 已 经 在 同 级 词法 域 声明 过 的 变量 才 和 赋值 操作 语句 等 价 ， 如 果 变 量 
是 在 外 部 词法 域 声明 的 ， 那 么 简短 变量 声明 语句 将 会 在 当前 词法 域 重 新 声明 一 个 新 的 变量 。 


2.3.2. 指针 


一 个 变量 对 应 一 个 保存 了 变量 对 应 类 型 值 的 内 存 空间 。 首 通 变 量 在 声明 语句 创建 时 被 绑 定 到 
一 个 变量 名 ， 比 如 叫 x 的 变量 ， 但 是 还 有 很 多 变量 始终 以 表达 式 方式 引入 ， 例 如 Xi 或 x.f 变 量 。 
所 有 这 些 表 达 式 一 般 都 是 读 取 一 个 变量 的 值 ， 除非 它们 是 出 现在 赋值 语句 的 左边 ， 这 种 时 候 
是 给 对 应 变量 赋予 一 个 新 的 值 。 


一 个 指针 的 值 是 另 一 个 变量 的 地 址 。 一 个 指针 对 应 变量 在 内 存 中 的 存储 位 置 。 并 不 是 每 一 个 
值 都 会 有 一 个 内 存 地 址 ， 但 是 对 于 每 一 个 变量 必然 有 对 应 的 内 存 地 址 。 通 过 指针 ， 我 们 可 以 
直接 读 或 更 新 对 应 变量 的 值 ， 而 不 需要 知道 该 变量 的 名 字 〈 如 果 变 量 有 名 字 的 话 ) o 


如 果 用 “var xint" 声 明 语 名 声明 一 个 X 变 量 ， 那 么 &x 表 达 式 〈 取 X 变 量 的 内 存 地 址 ) 将 产生 一 个 
指向 该 整数 变量 的 指针 ， 指 针对 应 的 数据 类 型 是 *int ， 指 针 被 称 之 为 “指向 int 类 型 的 指针 ”。 
如 果 指 针 名 字 为 p， 那 么 可 以 说 “p 指 针 指 向 变量 x”， 或 者 说 “p 指 针 保 存 了 x 变量 的 内 存 地 址 ”。 
同时 *p 表达 式 对 应 p 指 针 指 向 的 变量 的 值 。 一 般 *p 表达 式 读 取 指 针 指 向 的 变量 的 值 ， 这 里 
为 int 类 型 的 值 ， 同时 因为 *p 对 应 一 个 变量 ， 所 以 该 表达 式 也 可 以 出 现在 赋值 语句 的 左边 ， 表 
示 更 新 指针 所 指向 的 变量 的 值 。 


X i= 1 

p := &x Lia Ole Ee aE ONNES Eo e 
fmt.Println(*p) // "i" 

*p = 2 // equivalent to x = 2 


fmt.Println(x) // "2" 





对 于 聚合 类 型 每 个 成 员 一 一 比如 结构 体 的 每 个 字段 、 或 者 是 数组 的 每 个 元 素 一 一 也 都 是 对 应 
一 个 变量 ， 因 此 可 以 被 取 地 址 。 


变量 有 时 候 被 称 为 可 寻 址 的 值 。 即 使 变量 由 表达 式 临时 生成 ， 那 么 表达 式 也 必须 能 接受 & 取 
地 址 操作 。 

任何 类 型 的 指针 的 零 值 都 是 nil。 如 果 p != nil 测试 为 真 ， 那 么 p 是 指向 某 个 有 效 变 量 。 指 针 
之 间 也 是 可 以 进行 相等 测试 的 ， 只 有 当 它 们 指向 同一 个 变量 或 全 部 是 nil 时 才 相 等 。 


var xX, y int 
fmt.Println(&x == &x, &x == &y, &x == nil) // "true false false" 


EGOS P > RA HAP DRE SHAWLS o Ht FMR AALAN AA 
部 变量 vV， 在 局 部 变量 地 址 被 返回 之 后 依然 有 效 ， 因 为 指针 p 依 然 引 用 这 个 变量 。 

var p= f() 

func f() *int { 


v := 1 
return &v 


AE KA FA FB AB AG ED HER : 


fmt.Printin(f() == f()) // "false" 


因为 指针 包含 了 一 个 变量 的 地 址 ， 因 此 如 果 将 指针 作为 参数 调用 函数 ， 那 将 可 以 在 函数 中 通 
过 该 指针 来 更 新 变量 的 值 。 例 如 下 面 这 个 例子 就 是 通过 指针 来 更 新 变量 的 值 ， 然 后 返回 更 新 
后 的 值 ， 可 用 在 一 个 表达 式 中 (译注 : 这 是 对 C 语 言 中 +v 操作 的 模拟 ， 这 里 只 是 为 了 说 明 
指针 的 用 法 ，incr 亟 数 模 拟 的 做 法 并 不 推荐 ) 


func incr(p *int) int { 


*p++ // 非常 重要 : 只 是 增加 p 指 向 的 变量 的 值 ， 并 不 改变 p 指 针 1 ! | 
return *p 

v := 1 

incr (&v) // side effect: v is now 2 


fmt.Println(incr(&v)) // "3" (and v is 3) 


每 次 我 们 对 一 个 变量 取 地 址 ， 或 者 复制 指针 ， 我 们 都 是 为 原 变量 创建 了 新 的 别名 。 例 
如 ，*p 就 是 是 变量 v 的 别名 。 指 针 特 别 有 价 值 的 地 方 在 于 我 们 可 以 不 用 名 字 而 访问 一 个 变 
量 ， 但 是 这 是 一 把 双 刃 剑 : 要 找到 一 个 变量 的 所 有 访问 者 并 不 容易 ， 我 们 必须 知道 变量 全 部 


的 别名 (译注 : 这 是 Go 语言 的 垃圾 回收 器 所 做 的 工作 ) 。 不 仅仅 是 指针 会 创建 别名 ， 很 多 其 
他 引用 类 型 也 会 创建 别名 ， 例 如 slice、map 和 chan， 甚 至 结构 体 、 数 组 和 接口 都 会 创建 所 引 
用 变量 的 别名 


指针 是 实现 标准 库 Thag 包 的 — ， 它 使 用 命令 行 参 数 来 设置 对 应 变量 的 值 ， 而 这 些 对 应 
命令 行 标志 参数 的 变量 可 能 会 零散 分 布 在 整个 程序 中 。 为 了 说 明 这 一 点 ， 在 早 些 的 echo 版 本 
ys sae -n 用 于 忽略 行 尾 的 换行 符 ， -s sep 用 于 指定 分 隔 字 
F (Rie BH) 。 下 面 这 是 第 四 个 版 本 ， 对 应 包 路 径 为 gopl.io/ch2/echo4 ° 


W = # 


gopl.io/ch2/echo4 


// Echo4 prints its command-line arguments. 


package main 


import ( 
Uflag! 
"Fme" 
tstringsi 


) 


var n = flag.Bool("n", false, "omit trailing newline") 
var sep = flag.String("s", " ", "separator") 


func main() { 
flag.Parse() 
fmt.Print(strings.Join(flag.Args(), *sep)) 
if !*n { 
fmt.Printin() 


WA flag.Bool BAS 4] #— HM RA EBARN ES © CHARA: 第 一 个 是 的 命 
令 行 标志 参数 的 名 字 “n”"， 然 后 是 该 标志 参数 的 默认 值 (这 里 是 false) ， 最 后 是 该 标志 参数 对 
应 的 描述 信息 。 如 果 用 户 在 命令 行 输入 了 一 个 无 效 的 标志 di ， 或 者 输入 -h 或 -help # 
Ro AAA AT eee eee SERNA Fs Rife dais & o KVL > WA flag.String AZA T 
创建 一 个 对 应 字符 串 类 型 的 标志 参数 变量 ， 同 样 包含 命 令 行 标志 参数 对 应 的 参数 名 、 黑 认 
值 、 和 描述 信息 。 程 序 中 的 sep 和 n 变量 分 别 是 指向 对 应 命令 行 标志 参数 变量 的 指针 ， 因 此 
必须 用 *sep 和 *n 形式 的 指针 语法 间接 引用 它们 。 


当 程 序 运行 时 ， 必 须 在 使 用 标志 参数 对 应 的 变量 之 前 调用 先 flag.Parse 函 数 ， 用 于 更 新 每 个 标 
志 参 数 对 应 变量 的 值 (之 前 是 默认 值 ) 。 对 于 非 标 志 参 数 的 普通 命令 行 参 数 可 以 通过 调用 
flag.Args() 函 数 来 访问 ， 返 回 值 对 应 对 应 一 个 字符 串 类 型 的 slice。 如 果 在 flag.Parse 有 函数 解析 
命令 行 参 数 时 遇 到 错误 ， 默 认 将 打印 相关 的 提示 信息 ， 然 后 调用 os.Exit(2) 终 止 程序 。 


让 我 们 运行 一 些 echo 测 试用 例 : 


$ go build gopl.io/ch2/echo4 
$ ./echo4 a bc def 

a bc def 

$ ./echo4 -s / a be def 
a/bc/def 

$ ./echo4 -n a be def 

a bc def$ 

$ ./echo4 -help 

Usage of ./echo4: 


-n omit trailing newline 
-s string 
separator (default " ") 


2.3.3. new 24 2x 


另 一 个 创建 变量 的 方法 是 调用 用 内 建 的 new 函 数 。 PEANT ) 将 创建 一 个 T 类 型 的 匿名 变 
量 ， 初 始 化 为 T 类 型 的 零 值 ， 然 后 返回 变量 地 址 ， 返 回 的 指针 类 型 为 *T 。 


p := new(int) // p, *int 类 型 ， 指 向 匿名 的 int 变量 
fmt.Println(*p) // "o" 
*p = 2 // 设置 int 匿名 变量 的 值 为 2 


fmt.Println(*p) // "2" 


用 new 创 建 变量 和 普通 变量 声明 语句 方式 创建 变量 没有 什么 ， 除 了 不 需要 声明 一 个 临时 变 
量 的 名 字 外 ， 我 们 还 可 以 在 表达 式 中 使 用 new(T)。 换 言 之 ， ee ， 而 
不 是 一 个 新 的 基础 概念 。 


下 面 的 两 个 hewInt 了 部 数 有 着 相同 的 行为 : 


func newInt() *int { 
return new(int) 


func newInt() *int { 
var dummy int 
return &dummy 


每 次 调用 new 哆 数 都 是 返回 一 个 新 的 变量 的 地 址 ， 因 此 下 面 两 个 地 址 是 不 同 的 : 


p := new(int) 
q := new(int) 
fmt.Println(p == q) // "false" 


当然 也 可 能 有 特殊 情况 : 如 果 两 个 类 型 都 是 空 的 ， 也 就 是 说 类 型 的 大 小 是 0， 例 

如 struct{} 和 [O]int , 有 可 能 有 相 同 的 地 址 (依赖 具体 的 语言 实现 ) (译注 : 请 谨 懂 使 用 大 
小 为 0 的 类 型 ， 因 为 如 果 类 型 的 大 小 位 0 好 话 ， 可 能 导致 Go 语言 的 自动 垃圾 回收 器 有 不 同 的 行 
为 ， 具 体 请 查看 runtime.SetFinalizer 函数 相关 文档 ) © 


new 函 数 使 用 常见 相对 比较 少 ， 因 为 对 应 结构 体 来 说 ， 可 以 直接 用 字面 量 语法 创建 新 变量 的 方 
法 会 更 灵活 (S4.4.1) 。 


由 于 new 只 是 一 个 预定 义 的 函数 ， 它 并 不 是 一 个 关键 字 ， 因 此 我 们 可 以 将 new 名 字 重 新 定义 为 
别 的 类 型 。 例 如 下 面 的 例子 : 


func delta(old, new int) int { return new - old } 
由 于 new 被 定义 为 int 类 型 的 变量 名 ， 因 此 在 delta 元 数 内 部 是 无 法 使 用 内 置 的 new 况 数 的 。 


2.3.4. 变量 的 生命 周期 


变量 的 生命 周期 指 的 是 在 程序 运行 期 间 变 量 有 效 存在 的 时 间 间隔 。 对 于 在 包 一 级 声明 的 变量 
来 说 ， 它 们 的 生命 周期 和 整个 程序 的 运行 周期 是 一 致 的 。 而 相 比 之 下 ， 在 局 部 变量 的 声明 周 
期 则 是 动态 的 : 从 每 次 创建 一 个 新 变量 的 声明 语句 开始 ， 直 到 该 变量 不 再 被 引用 为 止 ， 然 后 
变量 的 存储 宝 间 可 能 被 回收 。 函 数 的 参数 变量 和 返回 值 变量 都 是 局 部 变量 。 它 们 在 函数 每 次 
被 调用 的 时 候 创建 。 


例如 ， 下 面 是 从 1.4 节 的 Lissajous 程 序 摘录 的 代码 片段 : 


for t := 0.0; t < cycles*2*math.Pi; t += res { 
x := math.Sin(t) 
y := math.Sin(t*freq + phase) 
img.SetColorIndex(sizet+int(x*sizet+0.5), sizetint(y*size+0.5), 
blackIndex) 


译注 : RRMA EMAL ARR ANAT AAR RAIE G MIGADS Mm 
导致 的 编译 错误 ， 可 以 在 末尾 的 参数 变量 后 面 显 式 持 入 过 号 。 像 下 面 这 样 : 


fornt 0.0; t < cycles*2*math.Pi; t += res { 
x := math.Sin(t) 
y := math.Sin(t*freq + phase) 


img .SetColorIndex( 
sizetint(x*sizet+0.5), sizet+tint(y*sizet+0.5), 


blackIndex, // 最 后 插入 的 运 号 文 是 GO 编译 器 的 一 个 特性 





在 每 次 循环 的 开始 会 创建 临时 变量 t， 然 后 在 每 次 循环 迭代 中 创建 临时 变量 x 和 y。 


那么 Go 语言 的 自动 圾 收集 器 是 如 何 知道 一 个 变量 是 何 时 可 以 被 回收 的 呢 ? 这 里 我 们 可 以 避 开 
完整 的 技术 细节 ， 基 本 的 实现 思路 是 ， 从 每 个 包 级 的 变量 和 每 个 当前 运行 函数 的 每 一 个 局 部 
变量 开始 ， 通 过 指针 或 引用 的 访问 路 径 遍 历 ， 是 否 可 以 找到 该 变量 。 如 果 不 存 在 这 样 的 访问 
路 径 ， 那 么 说 明 该 变量 是 不 可 达 的 ， 也 就 是 说 它 是 否 存 在 并 不 会 影响 程序 后 续 的 计算 结果 。 


为 一 个 变量 的 有 效 周期 只 取决 于 是 否 可 达 ， 因 此 一 个 循环 迭代 内 部 的 局 部 变量 的 生命 周期 
可 能 超出 其 局 部 作用 域 。 同 时 ， 局 部 变量 可 能 在 函数 返回 之 后 依然 存在 。 


编译 器 会 自动 选择 在 栈 上 还 是 在 堆 上 分 配 局 部 变量 的 存储 空间 ， 但 可 能 令 人 惊讶 的 是 ， 这 个 
选择 并 不 是 由 用 var 还 是 new 声 明 变 量 的 方式 决定 的 。 


var global *int 


func f() { 
var x int 
X= 
global = &x 
} 


func g() { 
:= new(int) 
*y = 工 


f 吕 数 里 的 x 变量 必须 在 堆 上 分 配 ， 因 为 它 在 函数 退出 后 依然 可 以 通过 包 一 级 的 global 变 量 找 

到 ， 虽 然 它 是 在 函数 内 部 定义 的 ; 用 Go 语言 的 术语 说 ， 这 个 x 局 部 变量 从 函数 f 中 逃 选 了 。 相 
反 ， 当 g 函 数 返回 时 ， 变 量 *y 将 是 不 可 达 的 ， 也 就 是 说 可 以 马上 被 回收 的 。 因 此 ，*y HR 
有 从 函数 g 中 逃逸 ， 编 译 器 可 以 选择 在 栈 上 分 配 *y 的 存储 空间 (译注 : 也 可 以 选择 在 堆 上 分 
配 ， 然 后 由 Go 语言 的 GC 回 收 这 个 变量 的 内 存 空间 ) ， 虽 然 这 里 用 的 是 new 方 式 。 其 实在 任何 
时 候 ， 你 并 不 需 为 了 编写 正确 的 代码 而 要 考虑 变量 的 逃逸 行为 ， 要 记 住 的 是 ， 逃 逸 的 变量 需 
要 额外 分 配 内 存 ， 同 时 对 性 能 的 优化 可 能 会 产生 细微 的 影响 。 


Go 语言 的 自动 垃圾 收集 器 对 编写 正确 的 代码 是 一 个 巨大 的 帮助 ， 但 也 并 不 是 说 你 完全 不 用 考 
虑 内 存 了 。 你 虽然 不 需要 显 式 地 分 配 和 释放 内 存 ， 但 是 要 编写 高 效 的 程序 你 依然 需要 了 解 变 
量 的 生命 周期 。 例 如 ， 如 果 将 指向 短 生命 周期 对 象 的 指针 保存 到 具有 长 生命 周期 的 对 象 中 ， 
特别 是 保存 到 全 局 变量 时 ， 会 阻止 对 短 生命 周期 对 象 的 垃圾 回收 (从 而 可 能 影响 程序 的 性 


AG 
AG È 


2.4. 赋值 


使 用 赋值 语句 可 以 更 新 一 个 变量 的 值 ， 最 简单 的 赋值 语句 是 将 要 被 赋值 的 变量 放 在 = 的 左边 ， 
新 值 的 表达 式 放 在 = 的 右边 。 





x=1 // 4 RE AI RAE 

*p = true // 3 

person.name = "bob" Ide E 

count[x] = count[x] * scale // #21. slicex LAIR 


特定 的 二 元 算术 运算 符 和 赋值 语 多 的 复合 操作 有 一 个 简洁 形式 ， 例 如 上 面 最 后 的 语句 可 以 重 
写 为 : 


count[x] *= scale 


这 样 可 以 省 去 对 变量 表达 式 的 重复 计算 。 


数值 变量 也 可 以 支持 ++ 递增 和 -- 递减 语句 (译注 : 自 增 和 自 减 是 语句 ， 而 不 是 表达 式 ， 
此 x = i 之 类 的 表达 式 是 错误 的 ) 


WW Ret al 
V++ ie i A Vr a VS A 
V-- Ue a ol 


2.4.1. 元 组 赋值 

元 组 赋值 是 另 一 种 形式 的 赋值 语句 ， 它 允许 同时 更 新 多 个 变量 的 值 。 在 赋值 之 前 ， 赋 值 语 名 
右边 的 所 有 表达 式 将 会 先进 行 求 值 ， 然 后 再 统一 更 新 左边 对 应 变量 的 值 。 这 对 于 处 理 有 些 同 
时 出 现在 元 组 赋值 语 名 左右 两 边 的 变量 很 有 帮助 ， 例 如 我 们 可 以 这 样 交 换 两 个 变量 的 值 : 
xX, yY =y X 

afi], a[j] = a[j], a[i] 


或 者 是 计算 两 个 整数 值 的 的 最 大 公约 数 (GCD) (译注 : GCD 不 是 那个 敏感 字 ， 而 是 
greatest common divisor 的 缩写 ， 欧 几 里 德 的 GCD 是 最 早 的 非 平凡 算法 ) 


func gcd(x, y int) int { 
for y !=0 { 
X, Y= y, x%y 
} 


return x 


KAU HE KA BAH (Fibonacci) 的 第 N 个 数 : 


func fib(n int) int { 
xo SP BS (ele al 


GOR 2 = < nr 
X, y = Y, xty 

} 

return x 


元 组 赋值 也 可 以 使 一 系列 琐碎 赋值 更 加 紧凑 《译注 : 特别 是 在 for 循 环 的 初始 化 部 分 ) ， 


ay, Re ey, 


但 如 果 表 达 式 太 复杂 的 话 ， 应 该 尽量 避免 过 度 使 用 元 组 赋值 ; 因为 每 个 变量 单独 赋值 语句 的 
写法 可 读 性 会 更 好 。 


有 些 表达 式 会 产生 多 个 值 ， 比 如 调用 一 个 有 多 个 返回 值 的 函数 。 当 这 样 一 个 函数 调用 出 现在 
元 组 赋值 右边 的 表达 式 中 时 (译注 : 右边 不 能 再 有 其 它 表达 式 ) ， 左 边 变 量 的 数目 必须 和 右 
边 一 致 。 


f, err = os.Open("foo.txt") // function call returns two values 


通常 ， 这 类 函数 会 用 额外 的 返回 值 来 表达 nie 类 型 ， 例 如 os.Open 是 用 额外 的 返回 值 返 回 
一 个 error 类 型 的 错误 ， 还 有 一 些 是 用 来 返回 布尔 值 ， 通 常 被 称 为 ok。 在 稍 后 我 们 将 看 到 的 三 
个 操作 都 是 类 似 的 用 法 。 如 果 map 查 找 (S4.3) ` S (§7.10) 或 通道 接收 (§8.4.2) 
出 现在 赋值 语句 的 右边 ， 它 们 都 可 能 会 产生 两 个 结果 ， pa 外 的 布尔 结果 表示 操作 是 否 
成 功 : 


v, ok = m[key] // map lookup 
v, ok = x.(T) // type assertion 
v, ok = <-ch // channel receive 


译注 : map 查 找 (§4.3) 、 类 型 断言 (§7.10) 或 通道 接收 (§8.4.2) 出 现在 赋值 语句 的 右边 
时 ， 并 不 一 定 是 产生 两 个 结果 ， 也 可 能 只 产生 一 个 结果 。 对 于 值 产 生 一 个 结果 的 情形 ，map 
查找 失败 时 会 返回 零 值 ， 类 型 断言 失败 时 会 发 送 运 行 时 panic 弄 常 ， 通 道 接 收 失败 时 会 返回 零 


fi (阻塞 不 算是 失败 ) 。 例 如 下 面 的 例子 : 





v = m[key] // map 查 找 ， 失 败 时 返回 零 值 

Vv = x.(T) // typebi g 

v = <-ch // BIE > KI RIL AR 
_, ok = m[key] // map 返 回 2 个 值 

_, ok = mm[""], false // map ®© fe 





— = mm[""] // map 返 回 1 个 值 


和 变量 声明 一 样 ， 我 们 可 以 用 下 划 线 空白 标识 符 “来 丢弃 不 需要 的 值 。 


_, err = io.Copy(dst, src) // AFT% 
_, ok = x.(T) // 只 检测 类 型 ， 忽 略 具体 值 





2.4.2. 可 赋值 性 


赋值 语句 是 显 式 的 赋值 形式 ， 但 是 程序 中 还 有 很 多 地 方 会 发 生 隐 式 的 赋值 行为 : 函数 调用 会 
隐 式 地 将 调用 参数 的 值 赋值 给 函数 的 参数 变量 ， 一 个 返回 语句 将 隐 式 地 将 返回 操作 的 值 赋值 
给 结果 变量 ， 一 个 复合 类 型 的 字面 量 (§4.2) 也 会 产生 赋值 行为 。 例 如 下 面 的 语句 : 


medals := []string{"gold", "silver", "bronze"} 


隐 式 地 对 slice 的 每 个 元 素 进行 赋值 操作 ， 类 似 这 样 写 的 行为 : 


medals[0] = "gold" 
medals[i] = "silver" 
medals[2] = "bronze" 


map 和 chan 的 元 素 ， 虽 然 不 是 普通 的 变量 ， 但 是 也 有 类 似 的 隐 式 赋值 行为 。 


不 管 是 隐 式 还 是 显 式 地 赋值 ， 在 赋值 语句 左边 的 变量 和 右边 最 终 的 求 到 的 值 必须 有 相同 的 数 
据 类 型 。 更 直 白地 说 ， 只 有 右边 的 值 对 于 左边 的 变量 是 可 赋值 的 ， 赋 值 语句 才 是 允许 的 。 


可 赋值 性 的 规则 对 于 不 同类 型 有 着 不 同 要 求 ， 对 每 个 新 类 型 特殊 的 地 方 我 们 会 专门 解释 。 对 
于 目前 我 们 已 经 讨论 过 的 类 型 ， 它 的 规则 是 简单 的 : 类 型 必须 完全 匹配 nil 可 以 赋值 给 任何 
指针 或 引用 类 型 的 变量 。 常 量 (§3.6) 则 有 更 灵活 的 赋值 规则 ， 因 为 这 样 可 以 避免 不 必要 的 
显 式 的 类 型 转换 。 


对 于 两 个 值 是 否 可 以 用 == 或 != 进行 相等 比较 的 能 力也 和 可 赋值 能 力 有 关系 : 对 于 任何 类 型 
的 值 的 相等 比较 ， 第 二 个 值 必 须 是 对 第 一 个 值 类 型 对 应 的 变量 是 可 赋值 的 ， 反 之 依然 。 和 前 
面 一 样 ， 我 们 会 对 每 个 新 类 型 比较 特殊 的 地 方 做 专门 的 解释 。 


赋值 
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2.5. 类 型 


变量 或 表达 式 的 类 型 定义 了 对 应 存储 值 的 属性 特征 ， 例 如 数值 在 内 存 的 存储 大 小 〈 或 者 是 元 
素 的 bit 个 数 ) ， 它 们 在 内 部 是 如 何 表达 的 ， 是 否 支持 一 些 操作 符 ， 以 及 它们 自己 关联 的 方法 


在 任何 程序 中 都 会 存在 一 些 变量 有 着 相同 的 内 部 结构 ， 但 是 却 表示 完全 不 同 的 概念 。 例 如 ， 
一 个 int 类 型 的 变量 可 以 用 来 表示 一 个 循环 的 迭代 索引 、 或 者 一 个 时 间 改 、 或 者 一 个 文件 描述 
符 、 或 者 一 个 月 份 ; 一 个 float64 类 型 的 变量 可 以 用 来 表示 每 秒 移动 几米 的 速度 、 或 者 是 不 同 
温度 单位 下 的 温度 ; 一 个 字符 串 可 以 用 来 表示 一 个 密码 或 者 一 个 颜色 的 名 称 。 


一 个 类 型 声明 语句 创建 了 一 个 新 的 类 型 名 称 ， 和 现 有 类 型 具有 相同 的 底层 结构 。 新 命名 的 类 
型 提供 了 一 个 方法 ， 用 来 分 隔 不 同 概念 的 类 型 ， 这 样 即使 它们 底层 类 型 相同 也 是 不 兼容 的 。 


type 类 型 名 字 底层 类 型 


类 型 声明 语句 一 般 出 现在 包 一 级 ， 因 此 如 果 新 创建 的 类 型 名 字 的 首 字 符 大 写 ， 则 在 外 部 包 也 
可 以 使 用 。 


译注 : 对 于 中 文 汉字 ，Unicode 标 志 都 作为 小 写字 母 处 理 ， 因 此 中 文 的 命名 默认 不 能 导出 ;不 
过 国内 的 用 户 针 对 该 问题 提出 了 不 同 的 看 法 ， 根 据 RobPike 的 回复 ， 在 Go2 中 有 可 能 会 将 中 日 
韩 等 字符 当 作 大 写字 母 处 理 。 下 面 是 RobPik 在 lssue763 的 回复 : 


A solution that's been kicking around for a while: 


For Go 2 (can't do it before then): Change the definition to “lower case letters and are 
package-local; all else is exported”. Then with non-cased languages, such as 
Japanese, we can write A 44% for an exported name and 日 本 语 for a local name. This 
rule has no effect, relative to the Go 1 rule, with cased languages. They behave exactly 
the same. 


为 了 说 明 类 型 声明 ， 我 们 将 不 同 温度 单位 分 别 定义 为 不 同 的 类 型 : 


gopl.io/ch2/tempconvO 


// Package tempconv performs Celsius and Fahrenheit temperature computations. 


package tempconv 


import "fmt" 


type Celsius float64 // 摄氏 
type Fahrenheit float64 // 华 








const ( 
AbsoluteZeroc Celsius = -273.15 // 绝对 零度 
FreezingC Celsius = 0 // 结 六 点 温度 
Boilingc Celsius = 100 // 沸水 温度 

) 


func CToF(c Celsius) Fahrenheit { return Fahrenheit(c*9/5 + 32) } 


func FToC(f Fahrenheit) Celsius { return Celsius((f - 32) * 5 / 9) } 


我 们 在 这 个 包 声 明了 两 种 类 型 : Celsius 和 Fahrenheit 分 别 对 应 不 同 的 温度 单位 。 它 们 虽然 有 
着 相同 的 底层 类 型 float64， 但 是 它们 是 不 同 的 数据 类 型 ， 因 此 它们 不 可 以 被 相互 比较 或 混在 
一 个 表达 式 运算 。 刻 意 区 分 类 型 ， 可 以 避免 一 些 像 无 意 中 使 用 不 同 单位 的 温度 混合 计算 导致 
的 错误 ; 因此 需要 一 个 类 似 Celsius(t) 或 Fahrenheit(t) 形 式 的 显 式 转型 操作 才能 将 float64 转 为 
对 应 的 类 型 。Celsius(t) 和 Fahrenheit(t) 是 类 型 转换 操作 ， 它 们 并 不 是 函数 调用 。 类 型 转换 不 
会 改变 值 本 身 ， 但 是 会 使 它们 的 语义 发 生变 化 。 另 一 方面 ，CToF 和 FToC 两 个 函数 则 是 对 不 同 
温度 单位 下 的 温度 进行 换算 ， 它 们 会 返回 不 同 的 值 。 


对 于 每 一 个 类 型 T， 都 有 一 个 对 应 的 类 型 转换 操作 T(x)， 用 于 将 x 转 为 T 类 型 (译注 : 如 果 T 是 
指针 类 型 ， 可 能 会 需要 用 小 括 弧 包 装 T， 比 如 (*int)(9) ) 。 只 有 当 两 个 类 型 的 底层 基础 类 型 
相同 时 ， 才 允许 这 种 转型 操作 ， 或 者 是 两 者 都 是 指向 相同 底层 结构 的 指针 类 型 ， 这 些 转换 只 
改变 类 型 而 不 会 影响 值 本 身 。 如 果 x 是 可 以 赋值 给 T 类 型 的 值 ， 那么 x 必然 也 可 以 被 转 为 T 类 

型 ， 但 是 一 般 没有 这 个 必要 。 


数值 类 型 之 间 的 转型 也 是 允许 的 ， 并 且 在 字符 串 和 一 些 特定 类 型 的 slice 之 间 也 是 可 以 转换 
的 ， 在 下 一 章 我 们 会 看 到 这 样 的 例子 。 这 类 转换 可 能 改变 值 的 表现 。 例 如 ， 将 一 个 浮 点 数 转 
为 整数 将 丢弃 小 数 部 分 ， 将 一 个 字符 串 转 为 [byte 类 型 的 slice 将 拷贝 一 个 字符 串 数 据 的 副 
本 。 在 任何 情况 下 ， 和 运行 时 不 会 发 生 转 换 失 败 的 错误 (译注: 错误 只 会 发 生 在 编译 阶段 ) 。 


底层 数据 类 型 决定 了 内 部 结构 和 表达 方式 ， 也 决定 是 否 可 以 像 底层 类 型 一 样 对 内 置 运算 符 的 
支持 。 这 意味 着 ，Celsius 和 Fahrenheit 类 型 的 算术 运算 行为 和 底层 的 float64 类 型 是 一 样 的 ， 
正如 我 们 所 期 望 的 那样 。 


fmt.Printf("%g\n", BoilingC-FreezingC) // "100" °C 

boilingF := CToF(BoilingC) 

fmt.Printf("%g\n", boilingF-CToF(FreezingC)) // "180" °F 

fmt.Printf("%g\n", boilingF-FreezingC) // compile error: type mismatch 


比较 运算 符 == 和 < 也 可 以 用 来 比较 一 个 命名 类 型 的 变量 和 另 一 个 有 相同 类 型 的 变量 ， 或 有 
兰 相 同 底层 类 型 的 未 命名 类型 的 值 之 间 生 比较。 但 是 如 果 两 个 值 有 着 不 同 的 类型， 则 不 能 丰 
接 进行 比较 ; 


var c Celsius 
var f Fahrenheit 


fmt.Println(c == 0) /ee il ue 
fmt.Println(f >= 0) ten 
fmt.Println(c == f) // compile error: type mismatch 


fmt.Println(c == Celsius(f)) // "true"! 


注意 最 后 那个 语句 。 尽 管 看 起 来 想 函 数 调用 ， 但 是 Celsius(f) 是 类 型 转换 操作 ， 它 并 不 会 改变 
值 ， 仅 仅 是 改变 值 的 类 型 而 已 。 测 试 为 真 的 原因 是 因为 cC 和 g 都 是 零 值 


o 


一 个 命名 的 类 型 可 以 提供 书写 方便 ， 特 别 是 可 以 避免 一 遍 又 一 遍地 书写 复杂 类 型 (1 
如 用 匿名 的 结构 体 定 义 变量 ) 。 虽 然 对 于 像 float64 这 种 简单 的 底层 类 型 没有 简洁 很 多 ， jek 
如 果 是 复杂 的 类 型 将 会 简洁 很 多 ， 特 别 是 我 们 即将 讨论 的 结构 体 类 型 。 


命名 类 型 还 可 以 为 该 类 型 的 值 定义 新 的 行为 。 这 些 行为 表示 为 一 组 关联 到 该 类 型 的 函数 集 
会 ， 我 们 称 为 类 型 的 方法 集 。 我 们 将 在 第 六 章 中 讨论 方法 的 细节 ， 这 里 值 说 写 简 单 用 法 。 


TF wa E WIS 4) >» Celsiusk # ee 了 函数 名 的 前 面 ， 表 示 声 明 的 是 Celsius 类 型 的 
一 个 叫 名 叫 String 的 方法 ， 该 方法 返回 该 类 型 对 象 C 带 着 "C 温 度 单位 的 字符 串 : 


func (c Celsius) String() string { return fmt.Sprintf("%g°C", c) } 


许多 类 型 都 会 定义 一 个 String 方 法 ， 因 为 当 使 用 fmt 包 的 打印 方法 时 ， 将 会 优先 使 用 该 类 型 对 
应 的 String 方 法 返回 的 结果 打印 ， 我 们 将 在 7.1 节 讲述 。 


c := FToC(212.0) 

fmt.Println(c.String()) // "100°C" 

fmt.Printf("%v\n", c) // "100°C"; no need to call String explicitly 
fmt.Printf("%s\n", c) Lilo Cs 

fmt.Println(c) e AIOE E 

fmt.Printf("%g\n", c) // "100"; does not call String 
fmt.Printin(float64(c)) // "100"; does not call String 


2.6. 包 和 文件 


Go 语言 中 的 包 和 其 他 语言 的 库 或 模块 的 概念 类 似 ， 目 的 都 是 为 了 支持 模块 化 、 封 装 、 单 独 编 
译 和 代码 重用 。 一 个 包 的 源 代 码 保 存在 一 个 或 多 个 以 .go 为 文件 后 组 名 的 源 文件 中 ， 通 常 一 个 
包 所 在 目录 路 径 的 后 组 是 包 的 导入 路 径 ; 例如 包 gopl.io/ch1/helloworld 对 应 的 目录 路 径 是 
$GOPATH/src/gopl.io/ch1/helloworld ° 


EA CLARA 2 A 1S FPE o Hil to > Himage & ¥ 49 Decode & 2 4e # unicode/utf16 & 
中 的 Decode 哆 数 是 不 同 的 。 要 在 外 部 引用 该 函数 ， 必 须 显 式 使 用 image.Decode 或 
utf16.Decode 形 式 访问 。 


包 还 可 以 让 我 们 通过 控制 哪些 名 字 是 外 部 可 见 的 来 隐藏 内 部 实现 信息 。 在 Go 语言 中 ， 一 个 简 
单 的 规则 是 : 如 果 一 个 名 字 是 大 写字 母 开 头 的 ， 那 么 该 名 字 是 导出 的 (译注 : 因为 汉字 不 区 
分 大 小 写 ， 因 此 汉字 开头 的 名 字 是 没有 导出 的 ) 。 

为 了 演示 包 基 本 的 用 法 ， 先 假设 我 们 的 温度 转换 软件 已 经 很 流行 ， 我 们 希望 到 Go 语言 社区 也 
能 使 用 这 个 包 。 我 们 该 如 何 做 呢 ? 

让 我 们 创建 一 个 名 为 gopl.io/ch2/tempconv 的 包 ， 这 是 前 面 例子 的 一 个 改进 版 本 。 (我 们 约定 
我 们 的 例子 都 是 以 章节 顺序 来 编号 的 ， 这 样 的 路 径 更 容易 阅读 ) 包 代 码 存储 在 两 个 源 文 件 

中 ， 用 来 演示 如 何在 一 个 源 文件 声明 然后 在 其 他 的 源 文 件 访问 ; 虽然 在 现实 中 ， 这 样 小 的 包 
一 般 只 需要 一 个 文件 。 


我 们 把 变量 的 声明 、 对 应 的 常量 ， 还 有 方法 都 放 到 tempconv.go 源 文件 中 : 
</i>gopl.io/ch2/tempconv</i> 


// Package tempconv performs Celsius and Fahrenheit conversions. 


package tempconv 
import "fmt" 


type Celsius float64 
type Fahrenheit float64 


const ( 
AbsoluteZeroC Celsius = -273.15 
FreezingC Celsius = 0 
BoilingC Celsius = 100 

) 


func (c Celsius) String() string { return fmt.Sprintf("%g°C", c) } 
func (f Fahrenheit) String() string { return fmt.Sprintf("%g°F", f) } 


转换 函数 则 放 在 另 一 个 conv.go 源 文件 中 : 


package tempconv 


// CToF converts a Celsius temperature to Fahrenheit. 
func CToF(c Celsius) Fahrenheit { return Fahrenheit(c*9/5 + 32) } 


// FToC converts a Fahrenheit temperature to Celsius. 
func FToC(f Fahrenheit) Celsius { return Celsius((f - 32) * 5 / 9) } 


每 个 源 文件 都 是 以 包 的 声明 语句 开始 ， 用 来 指名 包 的 名 字 。 当 包 被 导入 的 时 候 ， 包 内 的 成 员 

将 通过 类 似 tempconv.CToF 的 形式 访问 。 而 包 级 别 的 名 字 ， 例 如 在 一 个 文件 声明 的 类 型 和 常 

量 ， 在 同一 个 包 的 其 他 源 文件 也 是 可 以 直接 访问 的 ， 就 好 像 所 有 代码 都 在 一 个 文件 一 样 。 要 

注意 的 是 tempconv.go 源 文件 导入 了 fmt 包 ， 但 是 conv.go 源 文件 并 没有 ， 因 为 这 个 源 文件 中 的 
代码 并 没有 用 到 fmt 包 。 


为 包 级 别 的 常量 名 都 是 以 大 写字 母 开头 ， 它 们 可 以 像 tempconv.AbsoluteZeroC 这 样 被 外 部 
代码 访问 : 


fmt.Printf("Brrrr! %v\n", tempconv.AbsoluteZeroCc) // "Brrrr! -273.15°C" 


要 将 摄氏 温度 转换 为 华氏 温度 ， 需 要 先 用 import 语 句 导 入 gopl.io/ch2/tempconv 包 ， 然 后 就 可 
以 使 用 下 面 的 代码 进行 转换 了 : 


fmt.Println(tempconv.CToF(tempconv.BoilingC)) // "212°F" 


在 每 个 源 文件 的 包 声 明 前 仅 跟 着 的 注释 是 包 注 释 (S10.7.4) 。 通 常 ， 包 注释 的 第 一 句 应 该 先 
是 包 的 功能 概要 说 明 。 一 个 包 通 常 只 有 一 个 源 文件 有 包 注 释 (译注 : 如 果 有 多 个 包 注 释 ， 目 
前 的 文档 工具 会 根据 源 文件 名 的 先后 顺序 将 它们 链接 为 一 个 包 注 释 ) 。 如 果 包 注释 很 大 ， 通 
常会 放 到 一 个 独立 的 doc.go 文 件 中 。 


练习 2.1: 向 tempconv 包 添加 类 型 、 常 量 和 兄 数 用 来 处 理 Kelvin 绝 对 温度 的 转换 ，Kelvin % 
对 零度 是 -273.15*C，Kelvin 绝 对 温度 1K 和 摄氏 度 1"C 的 单位 问 隔 是 一 样 的 。 


2.6.1. 导入 包 


在 Go 语言 程序 中 ， 每 个 包 都 是 有 一 个 全 局 唯一 的 导入 路 径 。 导 入 语句 中 类 

似 "gopl.io/ch2/tempconv" 的 字符 串 对 应 包 的 导入 路 径 。Go 语 言 的 规范 并 没有 定义 这 些 字 符 囊 

的 具体 含义 或 包 来 自 哪 里 ， 它 们 是 由 构建 工具 来 解释 的 。 当 使 用 Go 语言 自 带 的 go 工具 箱 时 
(第 十 章 ) ， 一 个 导入 路 径 代 表 一 个 目录 中 的 一 个 或 多 个 Go 源 文件 。 


除了 包 的 导入 路 径 ， 每 个 包 还 有 一 个 包 名 ， 包 名 一 般 是 短小 的 名 字 (并 不 要 求 包 名 是 唯一 
的 ) ， 包 名 在 包 的 声明 处 指定 。 按 照 惯例 ， 一 个 包 的 名 字 和 包 的 导入 路 径 的 最 后 一 个 字段 相 


=> 


同 ， 例 如 gopl.io/ch2/tempconv 包 的 名 字 一 般 是 tempconv。 


要 使 用 gopl.io/ch2/tempconv 包 ， 需 要 先导 入 : 


gopl.io/ch2/cf 


// Cf converts its numeric argument to Celsius and Fahrenheit. 
package main 


import ( 
Mi 
roy 


"strconv" 


"gopl.io/ch2/tempconv" 
) 


func main() { 
for _, arg := range os.Args[1i:] { 


t, err := strconv.ParseFloat(arg, 64) 

if err != nil { 
fmt.Fprintf(os.Stderr, "cf: %v\n", err) 
os.Exit(1) 

} 

f := tempconv.Fahrenheit(t) 

c := tempconv.Celsius(t) 


fmt.Printf("%s = %s, %s = %s\n", 
f, tempconv.FToC(f), c, tempconv.CToF(c)) 


导入 语句 将 导入 的 包 绑 定 到 一 个 短小 的 名 字 ， 然 后 通过 该 短小 的 名 字 就 可 以 引用 包 中 导出 的 
全 部 内 容 。 上 面 的 导入 声明 将 允许 我 们 以 tempconv.CToF 的 形式 来 访问 gopl.io/ch2/tempconv 
包 中 的 内 容 。 在 默认 情况 下 ， 导 入 的 包 绑 定 到 tempconv 名 字 (译注 : 这 和 包 声 明 语 名 指定 的 名 
F) 9 eR] UBS ADGA VERS FIR (§10.4) © 


cf 程序 将 命令 行 输入 的 一 个 温度 在 Celsius 和 Fahrenheit 温 度 单位 之 间 转 换 : 


$ go build gopl.io/ch2/cf 


$ ./cf 32 

32°F = 0°C, 32°C = 89.6°F 

$ ./cf 212 

212°F = 100°C, 212°C = 413.6°F 
$ ./cf -40 


-40°F = -40°C, -40°C = -40°F 


如 果 导 入 了 一 个 包 ， 但 是 又 没有 使 用 该 包 将 被 当 作 一 个 编译 错误 处 理 。 这 种 强制 规则 可 以 有 
效 减 少 不 必要 的 依赖 ， 虽 然 在 调试 期 间 可 能 会 让 人 讨厌 ， 因 为 删除 一 个 类 似 log.Print("got 
here!") 的 打印 语句 可 能 导致 需要 同时 删除 log 包 导入 声明 ， 否 则 ， 编 译 器 将 会 发 出 一 个 错误 。 
在 这 种 情况 下 ， 我 们 需要 将 不 必要 的 导入 删除 或 注释 掉 。 


不 过 有 更 好 的 解决 方案 ， 我 们 可 以 使 用 golang.org/x/tools/cmd/goimports 导 入 工具 ， 它 可 以 根 
据 需要 自动 添加 或 删除 导入 的 包 ; 许多 编辑 器 都 可 以 集成 goimports 工 具 ， 然 后 在 保存 文件 的 
时 候 自 动 运 行 。 类 似 的 还 有 gofmt 工 具 ， 可 以 用 来 格式 化 Go 源 文 件 。 


练习 2.2 : 写 一 个 通用 的 单位 转换 程序 ， 用 类 似 cf 程 序 的 方式 从 命令 行 读 取 参 数 ， 如 果 缺 省 的 
话 则 是 从 标准 输入 读 取 参 数 ， 然 后 做 类 似 Celsius 和 Fahrenheit 的 单位 转换 ， 长 度 单位 可 以 对 
应 英尺 和 米 ， 重 量 单位 可 以 对 应 磅 和 公斤 等 。 


2.6.2. 包 的 初始 化 


包 的 初始 化 首先 是 解决 包 级 变量 的 依赖 顺序 ， 然 后 安 照 包 级 变量 声明 出 现 的 顺序 依次 初始 
Ww: 


vara=b+t+e//a wat 
var b = f() // b 第 二 
Wile =e al // C 1 





func f() int { return c + 1 } 


包 中 含有 多 个 .go 源 文件 ， 它 们 将 按照 发 给 编译 器 的 顺序 进行 初始 化 ，Go 语 言 的 构建 工具 
首先 会 将 .go 文件 根据 文件 名 排序 ， 然 后 依次 调用 编译 器 编译 。 


对 于 在 包 级 别 声 明 的 变量 ， 如 果 有 初始 化 表达 式 则 用 表达 式 初 始 化 ， 还 有 一 些 没有 初始 化 表 
达 式 的 ， 例 如 某 些 表 格 数据 初始 化 并 不 是 一 个 简单 的 赋值 过 程 。 在 这 种 情况 下 ， 我 们 可 以 用 
一 个 特殊 的 init 初 始 化 函数 来 简化 初始 化 工作 。 每 个 文件 都 可 以 包含 多 个 init 初 始 化 函数 


TRIM aU) ef ZF pon WY FP 


这 样 的 init 初 始 化 函数 除了 不 能 被 调用 或 引用 外 ， 其 他 行为 和 普通 函数 类 似 。 在 每 个 文件 中 的 
init 初 始 化 函数 ， 在 程序 开始 执行 时 按照 它们 声明 的 顺序 被 自动 调用 。 


每 个 包 在 解决 依赖 的 前 提 下 ， 以 导入 声明 的 顺序 初始 化 ， 每 个 包 只 会 被 初始 化 一 次 。 因 此 ， 
如 果 一 个 p 包 导入 了 q 包 ， 那 么 在 p 包 初始 化 的 时 候 可 以 认为 q 包 必然 已 经 初始 化 过 了 。 初 始 化 
工作 是 自 下 而 上 进行 的 ，main 包 最 后 被 初始 化 。 以 这 种 方式 ， 可 以 确保 在 main 兄 数 执 行 之 
前 ， 所 有 依然 的 包 都 已 经 完成 初始 化 工作 了 。 


下 面 的 代码 定义 了 一 个 PopCount 函 数 ， 用 于 返回 一 个 数字 中 含 二 进 制 1bit 的 个 数 。 它 使 用 init 
初始 化 函数 来 生成 辅助 表格 pc，pc 表 格 用 于 处 理 每 个 8bit 宽 度 的 数字 含 二 进 制 的 1bit 的 bit 个 

数 ， 这 样 的 话 在 处 理 64bit 宽 度 的 数字 时 就 没有 必要 循环 64 次 ， 只 需要 8 次 查 表 就 可 以 了 。 (这 
a a 的 算法 ， 但 是 它 可 以 方便 演示 init 函 数 的 用 法 ， 并 且 演 示 了 如 果 预 生 
成 辅助 表格 ， 这 是 编程 中 常用 的 技术 ) 。 


gopl.io/ch2/popcount 


package popcount 


// pc[i] is the population count of i. 
var pe [256]byte 


func init() { 
for i := range pc { 
pc[I] = pc[i/2] + byte(i&1) 


} 


// PopCount returns the population count (number of set bits) of x. 
func PopCount(x uint64) int { 
return int(pc[byte(x>>(0*8))] + 
pce[byte(x>>(1*8))] + 
pe[byte(x>>(2*8))] 
pe[byte(x>>(3*8))] 
pe[byte(x>>(4*8))] 
pe[byte(x>>(5*8))] 
pe[byte(x>>(6*8))] 
pe[byte(x>>(7*8))]) 


+ + + + + 


译注 : 对 于 pc 这 类 需要 复杂 处 理 的 初始 化 ， 可 以 通过 将 初始 化 逻辑 包装 为 一 个 匿名 函数 处 
理 ， 像 下 面 这 样 : 


// pc[i] is the population count of i. 
var pe [256]byte = func() (pc [256]byte) { 
for i := range pc { 
pc[i] = pc[i/2] + byte(i&1) 
} 


return 


}() 
要 注意 的 是 在 init 函 数 中 ，range 循 环 只 使 用 了 索引 ， 省 略 了 没有 用 到 的 值 部 分 。 循 环 也 可 以 这 
样 写 : 


for i, _ := range pe { 


我 们 在 下 一 节 和 10.5 节 还 将 看 到 其 它 使 用 init 部 数 的 地 方 。 


练习 2.3: 重 写 PopCount 函 数 ， 用 一 个 循环 代替 单一 的 表达 式 。 比 较 两 个 版 本 的 性 能 。 
(11.4 节 将 展示 如 何 系统 地 比较 两 个 不 同 实 现 的 性 能 。) 


练习 2.4 : 用 移 位 站 法 重 写 PopCount 函 数 ， 每 次 测试 最 右边 的 1bit， 然 后 统计 总 数 。 比 较 和 
查 表 工法 的 性 能 差异 。 


练习 2.5 : RAK xa(x-1) 用 于 将 x 的 最 低 的 一 个 非 零 的 bit 位 清 零 。 使 用 这 个 算法 重 写 
PopCount h že > AUG Hea PE Ae o 


2.7. 作用 域 


一 个 声明 语句 将 程序 中 的 实体 和 一 个 名 字 关 联 ， 比 如 一 个 函数 或 一 个 变量 。 声 明 语句 的 作用 
域 是 指 源 代码 中 可 以 有 效 使 用 这 个 名 字 的 范围 。 


不 要 将 作用 域 和 生命 周期 混为一谈 。 声 明 语 句 的 作用 域 对 应 的 是 一 个 源 代码 的 文本 区 域 E 
是 一 个 编译 时 的 属性 。 一 个 变量 的 生命 周期 是 指 程序 运行 时 变量 存在 的 有 效 时 间 段 ， 在 此 时 
间 区 域内 它 可 以 被 程序 的 其 他 部 分 引用 ; 是 一 个 运行 时 的 概念 。 


语法 块 是 由 花 括 缴 所 包含 的 一 系列 语句 ， 就 像 函 数 体 或 循环 体 花 括 缴 对 应 的 语法 块 那样 。 语 
法 块 内 部 声明 的 名 字 是 无 法 被 外 部 语法 块 访问 的 。 语 法 决定 了 内 部 声明 的 名 字 的 作用 域 范 

围 。 我 们 可 以 这 样 理解 ， 语 法 块 可 以 包含 其 他 类 似 组 批量 声明 等 没有 用 花 括 缴 包 人 钨 的 代码 ， 
我 们 称 之 为 语法 块 。 有 一 个 语法 块 为 整个 源 代码 ， 称 为 全 局 语法 块 ; 然后 是 每 个 包 的 包 语法 
决 ; 每 个 for、if 和 switch 语 和 句 的 语法 决 ; 每 个 switch 或 select 的 分 支 也 有 独立 的 语法 决 ; 当然 也 
包括 显 式 书写 的 语法 块 ( 花 括 张 包含 的 语句 ) o 


声明 语句 对 应 的 词法 域 决定 了 作用 域 范围 的 大 小 。 对 于 内 置 的 类 型 、 函 数 和 常量 ， 比 如 int、 
len 和 true 等 是 在 全 局 作用 域 的 ， 因 此 可 以 在 整个 程序 中 直接 使 用 。 任 何在 在 函数 外 部 〈 也 就 
是 包 级 语法 域 ) 声明 的 名 字 可 以 在 同一 个 包 的 任何 源 文 件 中 访问 的 。 对 于 导入 的 包 ， 例 如 
tempconv 导 入 的 fmt 包 ， 则 是 对 应 源 文件 级 的 作用 域 ， 因 此 只 能 在 当前 的 文件 中 访问 导入 的 
fmt 包 ， 当 前 包 的 其 它 源 文 件 无 法 访问 在 当前 源 文件 导入 的 包 。 还 有 许多 声明 语句 ， 比 如 
tempconv.CToF 函 数 中 的 变量 c， 则 是 局 部 作用 域 的 ， 它 只 能 在 函数 内 部 (其 至 只 能 是 局 部 的 


某 些 部 分 ) 访问 。 
控制 流标 号 ， 就 是 break、continue 或 goto 语 钨 后面 跟着 的 那 种 标号 ， 则 是 函数 级 的 作用 域 。 


一 个 程序 可 能 包含 多 个 同名 的 声明 ， 只 要 它们 在 不 同 的 词法 域 就 没有 关系 。 例 如 ， 你 可 以 声 

明 一 个 局 部 变量 ， 和 和 包 级 的 变量 同名 。 或 者 是 像 2.3.3 节 的 例子 那样 ， 你 可 以 将 一 个 函数 参数 
的 名 字 声 明 为 new， 虽 然 内 置 的 new 有 是 全 局 作用 域 的 。 但 是 物 极 必 反 ， 如 果 滥 用 不 同 词法 域 可 
重 名 的 特性 的 话 ， 可 能 导致 程序 很 难 阅 读 。 


当 编 译 器 遇 到 一 个 名 字 引 用 时 ， 如 果 它 看 起 来 像 一 个 声明 ， 它 首先 从 最 内 层 的 词法 域 向 全 局 
的 作用 域 查找 。 如 果 查 找 失败 ， 则 报告 “未 声明 的 名 字 ? 这 样 的 错误 。 如 果 该 名 字 在 内 部 和 外 部 
的 块 分 别 声明 过 ， 则 内 部 块 的 声明 首先 被 找到 。 在 这 种 情况 下 ， 内 部 声明 屏蔽 了 外 部 同名 的 
声明 ， 让 外 部 的 声明 的 名 字 无 法 被 访问 : 


func f() {} 
var g = ah 


func main() { 
fois "Ff" 
fmt.Printlin(f) // "f"; local var f shadows package-level func f 
fmt.Println(g) // "g"; package-level var 
fmt.Printin(h) // compile error: undefined: h 
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是 if 或 for 等 控制 流 语句 构造 的 。 ae e 变量 x， 因 为 它们 是 定义 在 不 同 的 词 
法 域 (这 个 例子 只 是 为 了 演示 作用 域 规则 ， 但 不 是 好 的 编程 风格 ) o 


func main() { 


x := "hello!" 
fonr i= 0; i < ren); Itt 
x := x[i] 
K Wee UI ae 
Xt AW a 


fmt.Printf("%c", x) // "HELLO" (one letter per iteration) 


在 x[i] Fe x + at - tat 声明 语句 的 初始 化 的 表达 式 中 都 引用 了 外 部 作用 域 声明 的 x 变量 ， 稍 
后 我 们 会 解释 这 个 。 ( 注意， 后 面 的 表达 式 与 unicode.ToUpper 并 不 等 价 。) 
正如 上 面 例子 所 示 ， 并 不 是 所 有 的 词法 域 都 显 式 地 对 应 到 由 花 括 弧 和 包含 的 语句 ; 还 有 一 些 隐 
含 的 规则 。 上 面 的 for 语 名 创建 了 两 个 词法 域 : 花 括 缴 包含 的 是 显 式 的 部 分 是 for 的 循环 体 部 分 
词法 域 ， 另 外 一 个 隐 式 的 部 分 则 是 循环 的 初始 化 部 分 ， 比 如 用 于 和 迭代 变量 ij 的 初始 化 。 隐 式 的 
词法 域 部 分 的 作用 域 还 包含 条 件 测 试 部 分 和 循环 后 的 和 迭代 部 分 ( i++ ) ， 当 然 也 包含 循环 体 
词法 域 。 

下 面 的 例子 同样 有 三 个 不 同 的 x 变量 ， 每 个 声明 在 不 同 的 词法 域 ， 一 个 在 函数 体 词法 域 ， 一 个 
在 for 隐 式 的 初始 化 词法 域 ， 一 个 在 for 循 环 体 词法 域 ; 只 有 两 个 块 是 显 式 创建 的 : 


func main() { 


x := "hello" 
for _, X := range x { 

x i= X + 'A' - 'a' 

fmt.Printf("%c", x) // "HELLO" (one letter per iteration) 
i 


和 for 循 环 类 似 ，if 和 switch 语 句 也 会 在 条 件 部 分 创建 隐 式 词法 域 ， 还 有 它们 对 应 的 执行 体 词法 
域 。 下 面 的 if-else 测 试 链 演示 了 x 和 y 的 有 效 作 用 域 范围 : 


if x := f(); x == 0 { 
fmt.Println(x) 

} else if y := g(x); xļx=y{ 
fmt.Println(x, y) 

} else { 
fmt.Println(x, y) 

} 


fmt.Printlin(x, y) // compile error: x and y are not visible here 


第 二 个 if 语 句 吝 套 在 第 一 个 内 部 ， 因 此 第 一 个 if 语 名 条件 初始 化 词法 域 声 明 的 变量 在 第 二 个 if 中 
也 可 以 访问 。switch 语 名 的 每 个 分 支 也 有 类 似 的 词法 域 规则 : 条 件 部 分 为 一 个 隐 式 词法 域 ， 然 
后 每 个 是 每 个 分 支 的 词法 域 。 


在 包 级 别 ， 声 明 的 顺序 并 不 会 影响 作用 域 范围 ， 因 此 一 个 先 声明 的 可 以 引用 它 自身 或 者 是 引 
用 后 面 的 一 个 声明 ， 这 可 以 让 我 们 定义 一 些 相 互 谋 套 或 递归 的 类 型 或 函数 。 但 是 如 果 一 个 变 
量 或 常量 递归 引用 了 自身 ， 则 会 产生 编译 错误 。 


在 这 个 程序 中 : 
if f, err := os.Open(fname); err != nil { // compile error: unused: f 
return err 
} 
f.ReadByte() // compile error: undefined f 
f.Close() // compile error: undefined f 


变量 {的 作用 域 只 有 在 if 语 句 内 ， 因 此 后 面 的 语句 将 无 法 引入 它 ， 这 将 导致 编译 错误 。 你 可 能 会 
收 到 一 个 局 部 变量 {没有 声明 的 错误 提示 ， 具 体 错误 信息 依赖 编译 器 的 实现 。 


通常 需要 在 if 之 前 声明 变量 ， 这 样 可 以 确保 后 面 的 语句 依然 可 以 访问 变量 : 


f, err := os.Open( fname) 
if err != nil { 
recurntenn 
} 
f .ReadByte() 
f.Close() 
你 可 能 会 考虑 通过 将 ReadByte 和 Close 移 动 到 if 的 else 块 来 解决 这 个 问题 : 


if f, err := os.Open(fname); err != nil { 
return err 
+ else { 
// ú and err are visible here too 
f .ReadByte() 
f.Close() 


但 这 不 是 Go 语言 推荐 的 做 法 ，Go 语 言 的 习惯 是 在 if 中 处 理 错误 然后 直接 返回 ， 这 样 可 以 确保 
正常 执行 的 语句 不 需要 代码 缩 进 。 


要 特别 注意 短 变量 声明 语句 的 作用 域 范围 ， 考 虑 下 面 的 程序 ， 它 的 目的 是 获取 当前 的 工作 目 
录 然 后 保存 到 一 个 包 级 的 变量 中 。 这 可 以 本 来 通过 直接 调用 os.Getwd 完 成 ， 但 是 将 这 个 从 主 
逻辑 中 分 离 出 来 可 能 会 更 好 ， 特 别 是 在 需要 处 理 错 误 的 时 候 。 函 数 log.Fatalf 用 于 打印 日 志 信 
息 ， 然 后 调用 os.Exit(1) 终 止 程序 。 


var cwd string 


func init() { 


cwd, err := os.Getwd() // compile error: unused: cwd 
if err != nil { 


log.Fatalf("os.Getwd failed: %v", err) 


} 


虽然 ewd 在 外 部 已 经 声明 过 ， 但 是 := 语句 还 是 将 cwd 和 err 重 新 声明 为 新 的 局 部 变量 。 因 为 内 


部 声明 的 cwd 将 屏蔽 外 部 的 声明 ， 因 此 上 面 的 代码 并 不 会 正确 更 新 包 级 声明 的 cwd 变 量 。 


由 于 当前 的 编译 器 会 检测 到 局 部 声明 的 cwd 并 没有 本 使 用 ， 然 后 报告 这 可 能 是 一 个 错误 ， 但 是 
这 种 检测 并 不 可 靠 。 因 为 一 些小 的 代码 变更 ， 例 如 增加 一 个 局 部 cwd 的 打印 语句 ， 就 可 能 导致 
这 种 检测 失效 。 


var cwd string 


func init() { 
cwd, err := os.Getwd() // NOTE: wrong! 
if err != nil { 


log.Fatalf("os.Getwd failed: %v", err) 
} 


log.Printf("Working directory = %s", cwd) 


全 局 的 cwd 变 量 依然 是 没有 被 正确 初始 化 的 ， 而 且 看 似 正 常 的 日 志 输 出 更 是 让 这 个 BUG 更 加 
1 Hi © 


有 许多 方式 可 以 避免 出 现 类 似 潜 在 的 问题 。 最 直接 的 方法 是 通过 单独 声明 err 变 量 ， 来 避免 使 
用 := 的 简短 声明 方式 : 


var cwd string 


func init() { 
var err error 
cwd, err = os.Getwd() 
if err != nil { 
log.Fatalf("os.Getwd failed: %v", err) 
} 


我 们 已 经 看 到 包 、 文 件 、 声 明和 语句 如 何 来 表达 一 个 程序 结构 。 在 下 面 的 两 个 章节 ， 我 们 将 
探讨 数据 的 结构 。 


第 三 章 基础 数据 类 型 


虽然 从 底层 而 言 ， 所 有 的 数据 都 是 由 比特 组 成 ， 但 计算 机 一 般 操作 的 是 固定 大 小 的 数 ， 如 整 
数 、 浮 点 数 、 比 特 数组 、 内 存 地 址 等 。 进 一 步 将 这 些 数组 织 在 一 起 ， 就 可 表达 更 多 的 对 象 ， 
例如 数据 包 、 像 素 点 、 诗 歌 ， 甚 至 其 他 任何 对 象 。Go 语 言 提供 了 丰富 的 数据 组 织 形 式 ， 这 依 
赖 于 Go 语言 内 置 的 数据 类 型 。 这 些 内 置 的 数据 类 型 ， 兼 顾 了 硬件 的 特性 和 表达 复杂 数据 结构 
的 便捷 性 。 

Go 语言 将 数据 类 型 分 为 四 类 : 基础 类 型 、 复 合 类 型 、 引 用 类 型 和 接口 类 型 。 本 章 介绍 基础 类 
型 ， 包 括 : 数字 、 字 符 串 和 布尔 型 。 复 合 数据 类 型 一 数组 (§4.1) 和 结构 体 (§4.2) 一 一 是 
通过 组 合 简单 类 型 ， 来 表达 更 加 复杂 的 数据 结构 。 引 用 类 型 包括 指针 (S2.3.2) 、 切 片 
(§4.2)) 字典 (§4.3) ` Hak (§5) 、 通 道 (§8) ， 虽 然 数 据 种 类 很 多 ， 但 它们 都 是 对 程序 
中 一 个 变量 或 状态 的 间接 引用 。 这 意味 着 对 任 一 引用 类 型 数据 的 修改 都 会 影响 所 有 该 引用 的 
拷贝 。 我 们 将 在 第 7 章 介绍 接口 类 型 。 


3.1. 整 型 


Go 语言 的 数值 类 型 包括 几 种 不 同 大 小 的 整形 数 、 浮 点 数 和 复数 。 每 种 数值 类 型 都 决定 了 对 应 
的 大 小 范围 和 是 否 支 持 正 负 符号 。 让 我 们 先 从 整形 数 类 型 开始 介绍 。 


Go 语言 同时 提供 了 有 符号 和 无 符号 类 型 的 整数 运算 。 这 里 有 int8、int16、int32 和 int64 四 种 截 
然 不 同 大 小 的 有 符号 整形 数 类 型 ， 分 别 对 应 8、16、32、64bit 大 小 的 有 符号 整形 数 ， 与 此 对 
应 的 是 uint8、uint16、uint32 和 uint64 四 种 无 符号 整形 数 类 型 。 

这 里 还 有 两 种 一 般 对 应 特定 CPU 平台 机 器 字 大 小 的 有 符号 和 无 符号 整数 int 和 uint ; 其 中 int 是 应 
用 最 广泛 的 数值 类 型 。 这 两 种 类 型 都 有 同样 的 大 小 ，32 或 64bit， 但 是 我 们 不 能 对 此 做 任何 的 
假设 ; 因为 不 同 的 编译 器 即使 在 相同 的 硬件 平台 上 可 能 产生 不 同 的 大 小 。 

Unicode 字 符 rune 类 型 是 和 int32 等 价 的 类 型 ， 通 常用 于 表示 一 个 Unicode 码 点 。 这 两 个 名 称 可 
以 互 换 使 用 。 同 样 byte 也 是 uint8 类 型 的 等 价 类 型 ，byte 类 型 一 般 用 于 强调 数值 是 一 个 原始 的 
数据 而 不 是 一 个 小 的 整数 。 

最 后 ， 还 有 一 种 无 符号 的 整数 类 型 uintptr， 没 有 指定 具体 的 bit 大 小 但 是 足以 容纳 指针 。Uuintptr 
类 型 只 有 在 底层 编程 是 才 需 要 ， 特 别 是 Go 语言 和 C 语 言 函数 库 或 操作 系统 接口 相交 互 的 地 
方 。 我 们 将 在 第 十 三 章 的 unsafe 包 相关 部 分 看 到 类 似 的 例子 。 

不 管 它们 的 具体 大 小 ，int、uint 和 uintptr 是 不 同类 型 的 兄弟 类 型 。 其 中 int 和 int32 也 是 不 同 的 类 
型 ， 即 使 int 的 大 小 也 是 32bit， 在 需要 将 int 当 作 int32 类 型 的 地 方 需 要 一 个 显 式 的 类 型 转换 操 
作 ， 反 之 亦 然 。 

其 中 有 符号 整数 采用 2 的 补 码 形式 表示 ， 也 就 是 最 高 bit 位 用 作 表 示 符号 位 ， 一 个 n-bit 的 有 符号 
数 的 值 域 是 从 一 2n-1 到 2n-1 一 1。 无 符号 整数 的 所 有 bit 位 都 用 于 表示 非 负 数 ， 值 域 是 0 到 

27 1。 例如 ，int8 类 型 整数 的 值 域 是 从 -128 到 127， 而 uint8 类 型 整数 的 值 域 是 从 0 到 255。 


下 面 是 Go 语言 中 关于 算术 运算 、 逻 辑 运 算 和 比较 运算 的 二 元 运算 符 ， 它 们 按照 先 级 递减 的 顺 
序 的 排列 : 


/ % << >> & &^ 
+ | ^ 

== I= < <= > >= 

&& 


二 元 运算 符 有 五 种 优先 级 。 在 同一 个 优先 级 ， 使 用 左 优先 结合 规则 ， 但 是 使 用 括号 可 以 明确 
优先 顺序 ， 使 用 括号 也 可 以 用 于 提升 优先 级 ， 例 如 mask & (1 << 28) ° 


对 于 上 表 中 前 两 行 的 运算 符 ， 例 如 + 运算 符 还 有 一 个 与 典 值 相 结 合 的 对 应 运算 符 +=， 可 以 用 于 
简 有 化 赋值 语 | g 


算术 运算 符 +、-、* 和 / 可 以 适用 与 于 整数 、 浮 点 数 和 复数 ， 但 是 取 模 运算 符 % 仅 用 于 整数 
间 的 运算 。 对 于 不 同 编程 语言 ，% 取 模 运 算 的 行为 可 能 并 不 相同 。 在 Go 语言 中 ，% 取 模 运 算 
符 的 符号 和 被 取 模 数 的 符号 总 是 一 致 的 ， 因 此 -5%3 和 -5%-3 结果 都 是 -2。 除 法 运算 符 / 的 
行为 则 依赖 于 操作 数 是 否 为 全 为 整数 ， 比 如 5.0/4.0 的 结果 是 1.25， 但 是 5/4 的 结果 是 1， 因 为 
整数 除法 会 向 着 0 方向 截断 余数 。 


如 果 一 个 算术 运算 的 结果 ， 不 管 是 有 符号 或 者 是 无 符号 的 ， 如 果 需 要 更 多 的 bit 位 才能 正确 表 
示 的 话 ， 就 说 明 计 算 结 果 是 溢出 了 。 超 出 的 高 位 的 bit 位 部 分 将 被 丢弃 。 如 果 原 始 的 数值 是 有 
符号 类 型 ， 而 且 最 左边 的 bit 为 是 1 的 话 ， 那 么 最 终结 果 可 能 是 负 的 ， 例 如 int8 的 例子 


var u uint8 = 255 
fmt.Printlin(u, u+i, u*u) // "255 0 1" 


varn 1 integ — A27 


MEA e280 
两 个 相同 的 整数 类 型 可 以 使 用 下 面 的 二 元 比较 运算 符 进行 比较 ; 比较 表达 式 的 结果 是 布尔 类 
型 。 

== equal to 

1= not equal to 

< less than 

<= less than or equal to 

> greater than 

>= greater than or equal to 


事实 上 ， 布 尔 型 、 数 字 类 型 和 字符 串 等 基本 类 型 都 是 可 比较 的 ， 也 就 是 说 两 个 相同 类 型 的 值 
可 以 用 == 和 != 进 行 比 较 。 此 外 ， 整 数 、 浮 点 数 和 字符 串 可 以 根据 比较 结果 排序 。 许 多 其 它 类 
型 的 值 可 能 是 不 可 比较 的 ， 因 此 也 就 可 能 是 不 可 排序 的 。 对 于 我 们 遇 到 的 每 种 类 型 ， 我 们 需 
要 保证 规则 的 一 致 性 。 


这 里 是 一 元 的 加 法 和 减法 运算 符 


十 


一 元 加 法 (无 效果 ) 


对 于 整数 ，+Xx 是 0+x 的 简写 ，-x 则 是 0-x 的 简写 ; 对 于 浮 点 数 和 复数 ，+X 就 是 x，-X 则 是 X 的 负 
数 。 
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Go 语言 还 提供 了 以 下 的 bit 位 操作 运算 符 ， 前 面 4 个 操作 运算 符 并 不 
数 : 


& 位 运算 AND 

| 位 运算 OR 

^ 位 运算 XOR 

&^ 位 清空 (AND NOT) 
<< 左 移 

>> 右 移 


位 操作 运算 符 ^ 作为 二 元 运算 符 时 是 按 位 异 或 (XOR) ， 当 用 作 一 元 运算 符 时 表示 按 位 取 
Kos 也 就 是 说 ， 它 返回 一 个 每 个 bit 位 都 取 反 的 数 。 位 操作 运算 符 gA 用 于 按 位 置 零 (AND 
NOT) : 表达 式 z = x &^ y 结果 z 的 bit 位 为 0， 如 果 对 应 y 中 bit 位 为 1 的 话 ， 否 则 对 应 的 bit 位 等 
于 Xx 相应 的 bit 位 的 值 。 


下 面 的 代码 演示 了 o ALAR TE fR AE uint8 K AA 048 NAR Abit © EAHA T Printf h žr 


的 %b 参 数 打印 二 进 制 格式 的 数字 ; 其 中 %08b 中 08 表 示 打 印 至 少 8 个 字符 宽度 ， 不 足 的 前 组 部 
分 用 0 填充 。 


var x uint8 = 1<<1 | 1<<5 
var y uint8 = 1<<1 | 1<<2 


fmt.Printf("%08b\n", x) // "00100010", the set {1, 5} 
fmt.Printf("%08b\n", y) // "00000110", the set {1, 2} 


fmt.Printf("%08b\n", x&y) // "00000010", the intersection {1} 
fmt.Printf("%08b\n", x|y) // "00100110", the union {1, 2, 5} 
fmt.Printf("%08b\n", xAy) // "00100100", the symmetric difference {2, 5} 
fmt.Printf("%08b\n", x&Ay) // "00100000", the difference {5} 

for i := uint(0); i < 8; it+ { 


if x&(1<<i) != © { // membership test 
Tae retire (SE). vf MU sy 


fmt.Printf("%08b\n", x<<1) // "01000100", the set {2, 6} 

fmt.Printf("%08b\n", x>>1) // "00010001", the set {0, 4} 

(6.5 节 给 出 了 一 个 可 以 远大 于 一 个 字 节 的 整数 集 的 实现 。) 
在 x<<n 和 x>>n 移 位 运算 中 ， 决 定 了 移 位 操作 bit 数 部 分 必须 是 无 符号 数 ; 被 操作 的 x 数 可 以 
是 有 符号 或 无 符号 数 。 算 术 上 ， 一 个 x<<n 左 移 运算 等 价 于 乘 以 2%， 一 个 x>>n 右 移 运 算 等 价 
于 除 以 2"。 


左 移 运 算 用 零 卉 充 右边 空缺 的 bt 位， 无 符号 数 的 右 移 运算 也 是 用 0 填充 左边 空缺 的 bit 位 ， 但 是 
有 符号 数 的 右 移 运算 会 用 符号 位 的 值 填 充 左边 空缺 的 bit 位 。 因 为 这 个 原因 ， 最 好 用 无 符号 运 
算 ， 这 样 你 可 以 将 整数 完全 当 作 一 个 bit 位 模式 处 理 。 


尽管 Go 语言 提供 了 无 符号 数 和 运算 ， 即 使 数值 本 身 不 可 能 出 现 负数 我 们 还 是 倾向 于 使 用 有 符 
号 的 int 类 型 ， 就 像 数组 的 长 度 那 样 ， 虽 然 使 用 uint 无 符号 类 型 似乎 是 一 个 更 合理 的 选择 。 事 实 
上 ， 内 置 的 len 函 数 返 回 一 个 有 符号 的 int， 我 们 可 以 像 下 面 例子 那样 处 理 逆序 循环 。 


medals := []string{"gold", "silver", "bronze"} 

for i := len(medals) - 1; i >= 0; i-- { 
fmt.Println(medals[i]) // "bronze", "silver", "gold" 

} 


另 一 个 选择 对 于 上 面 的 例子 来 说 将 是 灾难 性 的 。 如 果 |len 函 数 返 回 一 个 无 符号 数 ， 那 么 j 也 将 是 
无 符号 的 Uint 类 型 ， 然 后 条 件 i >= 6 UKXA o PAKERE RÆ i= 0 时 ，i-- 语 
名 将 不 会 产生 -1， 而 是 变 成 一 个 uint 类 型 的 最 大 值 (可 能 是 264 一 1) ， 然 后 medals[i] 表 达 式 将 
发 生 运行 时 panic 异 常 (§5.9) ， 也 就 是 试图 访问 一 个 slice 范 围 以 外 的 元 素 。 

出 于 这 个 原因 ， 无 符号 数 往往 只 有 在 位 运算 或 其 它 特殊 的 运算 场景 才 会 使 用 ， 就 像 bit 集 合 、 
分 析 二 进 制 文件 格式 或 者 是 哈 希 和 加 密 操 作 等 。 它 们 通常 并 不 用 于 仅仅 是 表达 非 负 数量 的 场 


> 
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一 般 来 说 ， 需 要 一 个 显 式 的 转换 将 一 个 值 从 一 种 类 型 转化 位 另 一 种 类 型 ， 并 且 算 术 和 逮 辑 运 
算 的 二 元 操作 中 必须 是 相同 的 类 型 。 虽 然 这 偶尔 会 导致 需要 很 长 的 表达 式 ， 但 是 它 消除 了 所 
有 和 类 型 相关 的 问题 ， 而 且 也 使 得 程序 容易 理解 。 


在 很 多 场景 ， 会 遇 到 类 似 下 面 的 代码 通用 的 错误 : 


var apples int32 = 1 
var oranges int16 = 2 
var compote int = apples + oranges // compile error 


当 尝 试 编译 这 三 个 语句 时 ， 将 产生 一 个 错误 信息 : 


invalid operation: apples + oranges (mismatched types int32 and int16) 


这 种 类 型 不 匹配 的 问题 可 以 有 几 种 不 同 的 方法 修复 ， 最 常见 方法 是 将 它们 都 显 式 转型 为 一 个 
常见 类 型 : 


党 


var compote = int(apples) + int(oranges) 


如 2.5 节 所 述 ， 对 于 每 种 类 型 T， 如 果 转 换 允 许 的 话 ， 类 型 转换 操作 T(x) 将 x 转换 为 T 类 型 。 许 多 
整形 数 之 间 的 相互 转换 并 不 会 改变 数值 ; 它们 只 是 告诉 编译 器 如 何 解释 这 个 值 。 但 是 对 于 将 
一 个 大 尺寸 的 整数 类 型 转 为 一 个 小 尺寸 的 整数 类 型 ， 或 者 是 将 一 个 浮 点 数 转 为 整数 ， 可 能 会 
改变 数值 或 丢失 精度 : 


ip t— 6241/7 ay flloated 


i := int(f) 
fmtiPreantlnGh, 2/7 “saa 3? 
f = 1.99 


fmt .Println(int(f)) // "1" 


浮 点 数 到 整数 的 转换 将 丢失 任何 小 数 部 分 ， 然 后 向 数 轴 零 方向 截断 。 你 应 该 避免 对 可 能 会 超 
出 目标 类 型 表示 范围 的 数值 类 型 转换 ， 因 为 截断 的 行为 可 能 依赖 于 具体 的 实现 : 


f := 1e100 // a float64 
int(f) // 结果 依赖 于 具体 实现 
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任何 大 小 的 整数 字面 值 都 可 以 用 以 0 开始 的 八进制 格式 书写 ， 例 如 0666 ; 或 用 以 0x 或 0X 开 头 
的 十 六 进 制 格式 书写 ， 例 如 0xdeadbeef。 十 六 进 制 数字 可 以 用 大 写 或 小 写字 母 。 如 今 八进制 
数据 通常 用 于 POSIX 操 作 系统 上 的 文件 访问 权限 标志 ， 十 六 进 制 数字 则 更 强调 数字 值 的 bit 位 
模式 。 


当 使 用 fmt 包 打印 一 个 数值 时 ， 我 们 可 以 用 %d、%o 或 %x 参 数控 制 输出 的 进 制 格 式 ， 就 像 下 面 
的 例子 : 


0 := 0666 

fmt.Printf("%d %[1]o %#[1]o\n", 0) // "438 666 0666" 
x := int64(Oxdeadbeef) 

fmt.Printf("%d %[1]x %#[1]x %#[1]X\n", x) 

// Output: 

// 3735928559 deadbeef Oxdeadbeef OXDEADBEEF 


请 注意 fmt 的 两 个 使 用 技巧 。 通 常 Printf 格 式 化 字符 串 包含 多 个 % 参 数 时 将 会 包含 对 应 相同 数量 
的 额外 操作 数 ， 但 是 % 之 后 的 [1] 副词 告诉 Printf 骂 数 再 次 使 用 第 一 个 操作 数 。 第 二 ，% 后 
的 # 副词 告诉 Printf 在 用 %o、%x 或 %X 输 出 时 生成 0、0x 或 0X 前 级 。 


字符 面值 通过 一 对 单 引 号 直接 包含 对 应 字符 。 最 简单 的 例子 是 ASCII 中 类 似 'a' 写 法 的 字符 面 
值 ， 但 是 我 们 也 可 以 通过 转 义 的 数值 来 表示 任意 的 Unicode 码 点 对 应 的 字符 ， 马 上 将 会 看 到 这 
样 的 例子 。 


字符 使 用 wc 参数 打印 ， 或 者 是 用 sg 参数 打印 带 单 引号 的 字符 : 


ascia := a 
unicode := ' 国 ' 
newline := '\n' 


fmt .Printf("%d %[1]c %[1]q\n", ascii) Wie VTE Bey Wb 
fmt .Printf("%d %[1]c %[1]q\n", unicode) // "22269 4 ' 国 "" 
fmt.Printf("%d %[1]q\n", newline) Bik BAO Nn 


ie 


= 


89 


3.2. 浮 点 数 


Go 语言 提供 了 两 种 精度 的 浮 点 数 ，float32 和 float64。 它 们 的 算术 规范 由 IEEE754 浮 点 数 国际 
标准 定义 ， 该 浮 点 数 规范 被 所 有 现代 的 CPU 支 持 。 


这 些 浮 点 数 类 型 的 取 值 范围 可 以 从 很 微小 到 很 巨大 。 浮 点 数 的 范围 极限 值 可 以 在 math 包 找 
到 。 常 量 math.MaxFloat32 表 示 float32 能 表示 的 最 大 数值 ， 大 约 是 3.4e38 ; 对 应 的 
math.MaxFloat64 常 量 大 约 是 1.8e308。 它 们 分 别 能 表示 的 最 小 值 近似 为 1.4e-45 和 4.9e-324。 


一 个 float32 类 型 的 浮 点 数 可 以 提供 大 约 6 个 十 进 制 数 的 精度 ， 而 float64 则 可 以 提供 约 15 个 十 进 
制 数 的 精度 ; 通常 应 该 优先 使 用 float64 类 型 ， 因 为 float32 类 型 的 累计 计算 误差 很 容易 扩散 ， 

并 且 float32 能 精确 表示 的 正 整 数 并 不 是 很 大 (译注 : 因为 float32 的 有 效 bit 位 只 有 23 人 个， 其它 
的 bit 位 用 于 指数 和 符号 ; 当 整 数 大 于 23bit 能 表达 的 范围 时 ，float32 的 表示 将 出 现 误差 ) 


var f float32 = 16777216 // 1 << 24 
fmt.Printlin(f == f+1) V/A true ll 


浮 点 数 的 字面 值 可 以 直接 写 小 数 部 分 ， 像 这 样 : 


const e = 2.71828 // (approximately) 


小 数 点 前 面 或 后 面 的 数字 部 可 能 被 省 略 (例如 .707 或 1.) 。 很 小 或 很 大 的 数 最 好 用 科学 计数 法 
书写 ， 通 过 e 或 E 来 指定 指数 部 分 : 


const Avogadro = 6.02214129e23 // RM47 wa 
const Planck = 6.62606957e-34 // FR THR 


用 Printf 函 数 的 %g 参 数 打 印 浮 点 数 ， 将 采用 更 紧凑 的 表示 形式 打印 ， 并 提供 足够 的 精度 ， 但 是 
对 应 表格 的 数据 ， 使 用 %e 〈 带 指数 ) 或 %f 的 形式 打印 可 能 更 合适 。 所 有 的 这 三 个 打印 形式 都 
可 以 指定 打印 的 宽度 和 控制 打印 精度 。 


for xX i= 0; x <8 Xit f 
fmt.Printf("x = %d eAx = %8.3f\n", x, math.Exp(float64(x))) 
} 


上 面 代码 打印 e 的 禹 ， 打 印 精 度 是 小 数 点 后 三 个 小 数 精度 和 8 个 字符 宽度 : 


= e^x = 1.000 
= eAx = 2.718 
= eAX = 7.389 
= e^x = 20.086 
= e^x = 54.598 


ex = 148.413 
ex = 403.429 
ex = 1096.633 


x *~ KX K KX O K XK 
N OO B WN KF O 


math 包 中 除了 提供 大 量 常用 的 数学 总数 外 ， 还 提供 了 IEEE754 浮 点 数 标准 中 定义 的 特殊 值 的 
创建 和 测试 : 正 无 穷 大 和 负 无 穷 大 ， 分 别 用 于 表示 太 大 溢出 的 数字 和 除 零 的 结果 ; 还 有 NaN 
非 数 ， 一 般 用 于 表示 无 效 的 除法 操作 结果 0/0 或 Sqrt(-1). 


var z float64 
fmt.Println(z, -z, 1/z, -1/z, z/z) // "0 -0 +Inf -Inf NaN" 


函数 math.IsSNaN 用 于 测试 一 个 数 是 否 是 非 数 NaN，math.NaN 则 返回 非 数 对 应 的 值 。 虽 然 可 以 
用 math.NaN 来 表示 一 个 非法 的 结果 ， 但 是 测试 一 个 结果 是 否 是 非 数 NaN 则 是 充满 风险 的 ， 
为 NaN 和 任何 数 都 是 不 相等 的 (译注 : 在 浮 点 数 中 ，NaN、 正 无 穷 大 和 负 无 穷 大 都 不 是 唯一 
的 ， 每 个 都 有 非常 多 种 的 bit 模 式 表示 ) 


nan := math.NaN() 
fmt.Println(nan == nan, nan < nan, nan > nan) // "false false false" 


如 果 一 个 函数 返回 的 浮 点 数 结果 可 能 失败 ， 最 好 的 做 法 是 用 单独 的 标志 报告 失败 ， 像 这 样 : 


func compute() (value float64, ok bool) { 


aa 
if failed { 

return 0, false 
} 


return result, true 


接 下 来 的 程序 演示 了 通过 浮 点 计算 生成 的 图 形 。 它 是 带 有 两 个 参数 的 Zz = fX y) BKM ARY 
式 ， 使 用 了 可 缩放 矢量 图 形 (SVG) 格式 输出 ，SVG 是 一 个 用 于 矢量 线 绘制 的 XML 标 准 。 图 
3.1 显 示 了 sin(r/r 远 数 的 输出 图 形 ， 其 中 r 是 sqrt(xx+yy)。 
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Figure 3.1. A surface plot of the function sin(r)/r. 


gopl.io/ch3/surface 


// Surface computes an SVG rendering of a 3-D surface function. 


package main 


import ( 
" fmt "m 
"math " 


const ( 
width, h 
cells 
xyrange 
xyscale 
zscale 
angle 


eight = 600, 320 
= 100 
= 30.0 


// canvas size in pixels 
7/ number of grid cells 
// axis ranges (-xyrange..+xyrange) 


= width / 2 / xyrange // pixels per x or y unit 


= height * 0.4 
= math.Pi / 6 


// pixels per z unit 
// angle of x, y axes (=30°) 


var sin30, cos30 = math.Sin(angle), math.Cos(angle) // sin(30°), cos(30°) 


func main() 


{ 


fmt .Printf("<svg xmlns='http://www.w3.org/2000/svg' "+ 
"style='stroke: grey; fill: white; stroke-width: 0.7' "+ 
"width='%d' height='%d'>", width, height) 


fom a) = 


0; i < cells; i++ { 


for j := 0; j < cells; jtt+ { 


ax, ay := corner(iti, j) 
bx, by := corner(i, j) 
cx, cy := corner(i, j+1) 


浮 点 数 


92 


dx, dy := corner(iti, j+1) 
fmt.Printf("<polygon points='%g,%g %g,%g %g,%g %g,%g'/>\n", 
ax, ay, bx, by, cx, cy, dx, dy) 


} 
fmt.Printin("</svg>") 


func corner(i, j int) (float64, float64) { 
// Find point (x,y) at corner of cell (i,j). 
x := xyrange * (float64(i)/cells - 0.5) 
xyrange * (float64(j)/cells - 0.5) 


// Compute surface height z. 
z := f(x, y) 


// Project (x,y,z) isometrically onto 2-D SVG canvas (sx,sy). 
sx := width/2 + (x-y)*cos30*xyscale 

sy := height/2 + (x+y)*sin30*xyscale - z*zscale 

return sx, sy 


func f(x, y float64) float64 { 
r := math.Hypot(x, y) // distance from (0,0) 
return math.Sin(r) / r 


要 注意 的 是 corner 函 数 返回 了 两 个 结果 ， 分 别 对 应 每 个 网 格 顶 点 的 坐标 参数 。 


要 解释 这 个 程序 是 如 何 工作 的 需要 一 些 基本 的 几何 学 知识 ， 但 是 我 们 可 以 跳 过 几何 学 原理 ， 
因为 程序 的 重点 是 演示 浮 点 数 运算 。 程 序 的 本 质 是 三 个 不 同 的 坐标 系 中 映射 关系 ， 如 图 3.2 所 
示 。 第 一 个 是 100x100 的 二 ae 
远 处 向 前 面 绘制 ， 因 此 远 处 先 绘制 的 多 边 形 有 可 能 被 前 面 后 绘制 的 多 边 形 徐 盖 。 


第 二 个 坐标 系 是 一 个 三 维 的 网 格 浮 点 坐标 (x,y,Z) ， 其 中 x 和 y 是 i 和 j 的 线性 函数 ， 通 过 平移 转换 
位 网 格 单元 的 中 心 ， 然 后 用 xyrange 系 数 缩放 。 高 度 zZ 是 函数 f(x,y) 的 值 。 


第 三 个 坐标 系 是 一 个 二 维 的 画布 ， 起 点 (0,0) 在 左上 角 。 画 布 中 点 的 坐标 用 (SX, Sy) 表示 。 我 们 
使 用 等 角 投 影 将 三 维 点 


+z (0,0) SX 





x -y 
+x 
o 
+Z 
+y +x 通 D 
-z sy 
2-D grid cells 3-D function space 2-D isometric projection 


Figure 3.2. Three different coordinate systems. 


(Xiy,z) 投 影 到 二 维 的 画布 中 。 画 布 中 从 远 处 到 右边 的 点 对 应 较 大 的 x 值 和 较 大 的 y 值 。 并 且 画 布 
中 x 和 y 值 越 大 ， 则 对 应 的 z 值 越 小 。X 和 y 的 垂直 和 水 平 缩放 系数 来 自 30 度 角 的 正弦 和 余弦 值 。 
z 的 缩放 系数 0.4， 是 一 个 任意 选择 的 参数 。 


对 于 二 维 网 格 中 的 每 一 个 网 格 单元 ，main 函 数 计算 单元 的 四 个 顶点 在 画布 中 对 应 多 边 形 
ABCD 的 顶点 ， 其 中 B 对 应 (ij) 顶 点 位 置 ， A、C 和 D 是 其 它 相 邻 的 顶点 ， 然 后 输出 SVG 的 绘制 


指令 。 


练习 3.1 : 如 果 f 函 数 返 
DRE 


回 的 是 无 限制 的 float64 值 ， 那 么 SVG 文件 可 能 输出 无 效 的 多 边 形 元 素 
(虽然 许多 SVG 浑 染 器 会 


会 妥善 处 理 这 类 问题 ) 。 修 改 程序 跳 过 无 效 的 多 边 形 。 
练习 3.2 : 试验 math 包 中 其 他 函数 的 泻 染 图 形 。 你 是 否 能 输出 一 个 egg box、moguls 或 a 
saddle 图 案 ? 


练习 3.3 : 根据 高 度 给 每 个 多 边 形 上 色 ， 那 样 峰值 部 将 是 红色 (#ff0000)， 谷 部 将 是 蓝 色 
(#0000ff) ° 


练习 3.4 : 参考 1.7 节 Lissajous 例 子 的 函数 ， 构 造 一 个 Web 服务器 ， 用 于 计算 函数 曲面 然后 返 
回 SVG 数 据 给 客户 端 。 服 务 器 必须 设置 Content-Type 头 部 : 


w.Header().Set("Content-Type", "image/svg+xml") 


(这 一 步 在 Lissajous 例 子 中 不 是 必须 的 ， 因 为 服务 器 使 用 标准 的 PNG 图 像 格式 ， 可 以 根据 前 
面 的 512 个 字 节 自动 输出 对 应 的 头 部 。) 允许 客户 端 通过 HTTP 请 求 参 数 设 置 高 度 、 宽 度 和 颜 
色 等 参数 。 


3.3. 复数 


Go 语言 提供 了 两 种 精度 的 复数 类 型 : complex64 和 complex128， 分 别 对 应 float32 和 float64 两 
种 浮 点 数 精度 。 内 置 的 complex 元 数 用 于 构建 复数 ， 内 建 的 real 和 imag 交 数 分 别 返 回复 数 的 实 
部 和 虚 部 


var x complex128 = complex(1, 2) // 1+2i 
var y complex128 = complex(3, 4) // 3+4i 


fmt.Println(x*y) Hye O 
fmt.Println(real(x*y)) I NEDE 
fmt.Println(imag(x*y)) J Malloy” 


如 果 一 个 浮 点 数 面 值 或 一 个 十 进 制 整 数 面值 后 面 跟着 一 个 1， 例如 3.141592i 或 21， 它 将 构成 一 
个 复数 的 虚 部 ， 复 数 的 实 部 是 0 : 


fmt.Printin(1i * 1i) // "(-1+0i)", i^2 = -1 
在 常量 算术 规则 下 ， 一 个 复数 常量 可 以 加 到 另 一 个 普通 数值 常量 (整数 或 浮 点 数 、 实 部 或 庶 


部 ) ， 我 们 可 以 用 自然 的 方式 书写 复数 ， 就 像 1+2i 或 与 之 等 价 的 写法 2i+1。 上 面 Xx 和 y 的 声明 语 
名 还 可 以 简化 : 


Xt 
y := 3 + 4i 


复数 也 可 以 用 == 和 != 进 行 相 等 比较 。 只 有 两 个 复数 的 实 部 和 虚 部 都 相等 的 时 候 它们 才 是 相等 
的 (译注 : 浮 点 数 的 相等 比较 是 危险 的 ， 需 要 特别 小 心 处 理 精度 问题 ) 。 


math/cmplx & 42 T Zab AV S HA > Hl to RH AN HAAR BA Fe RH BH © 


fmt.Println(cmplx.Sqrt(-1)) // "(0+11)" 


下 面 的 程序 使 用 complex128 复 数 算法 来 生成 一 个 Mandelbrot 图 像 。 


gopl.io/ch3/mandelbrot 


// Mandelbrot emits a PNG image of the Mandelbrot fractal. 
package main 


import ( 
"image" 
"image/color" 
"image/png" 
"math/cmplx" 
"os" 


func main() { 
const ( 
xmin, ymin, xmax, ymax = -2, -2, +2, +2 
width, height 1024, 1024 


img := image.NewRGBA(image.Rect(0, ©, width, height) ) 
for py := 0; py < height; pyt+ { 

y := float64(py)/height*(ymax-ymin) + ymin 

for px := 0; px < width; px++ { 


x := float64(px)/width*(xmax-xmin) + xmin 


z := complex(x, y) 


// Image point (px, py) represents complex value z. 
img.Set(px, py, mandelbrot(z)) 


} 


png.Encode(os.Stdout, img) // NOTE: ignoring errors 


func mandelbrot(z complex128) color.Color { 
const iterations = 200 
const contrast = 15 


var v complex128 
for n := uint8(0); n < iterations; n++ { 
v=avevt+z 
if cmplx.Abs(v) > 2 { 
return color.Gray{255 - contrast*n} 


} 


return color.Black 


用 于 遍历 1024x1024 图 像 每 个 点 的 两 个 许 套 的 循环 对 应 -2 到 +2 区 间 的 复数 平面 。 eo 
试 每 个 点 对 应 复数 值 平方 值 加 一 个 增 量 值 对 应 的 点 是 否 超出 半径 为 2 的 圆 。 如 果 超 过 了 ， 通 过 
根据 预 设置 的 逃 选 迭代 次 数 对 应 的 灰 度 颜色 来 代 蔡 。 如 果 不 是 ， 那 么 eee 
合 ， 使 用 黑色 颜色 标记 。 最 终 程 序 将 生成 的 PNG 格 式 分 形 图 像 图 像 输 出 到 标准 输出 ， 如 图 3.3 
所 示 。 





Figure 3.3. The Mandelbrot set. 


练习 3.5: 实现 一 个 彩色 的 Mandelbrot 图 像 ， 使 用 image.NewRGBA 创 建 图 像 ， 使 用 
colorRGBA 或 colorYCbCr 生 成 颜色 。 


练习 3.6 : 升 采样 技术 可 以 降低 每 个 像素 对 计算 颜色 值 和 平均 值 的 影响 。 简 单 的 方法 是 将 每 
个 像素 分 层 四 个 子 像素 ， 实 pe 


练习 3.7 : 另 一 个 生成 分 形 en 牛顿 法 来 求解 一 个 复数 方程 ， 例 如 z4 一 1 二 0。 
每 个 起 点 到 四 个 根 的 选 代 次 数 对 应 阴影 的 灰 度 。 方 程 根 对 应 的 点 用 颜色 表示 。 
练习 3.8: 通过 提高 精度 来 生成 更 多 级 别 的 分 形 。 使 用 四 种 不 同 精度 类 型 的 数字 实现 相同 的 


TH : complex64 ` scene 、big.Float 和 big.Rat。 (后 面 两 种 类 型 在 math/big 包 声明 ° 
Float 是 有 指定 限 精度 的 浮 点 数 ; Rat 是 无 效 精度 的 有 理 数 。) 它们 间 的 性 能 和 内 存 使 用 对 比如 
何 ? 当 泻 染 图 可 见 时 缩放 的 级 别 是 多 少 ? 


练习 3.9 : 编写 一 个 web 服 务 器 ， 用 于 给 客户 端 生成 分 形 的 图 像 。 运 行 客户 端 用 过 HTTP 参 数 
参数 指定 X,y 和 zoom 参数 。 


3.4. 布尔 型 


一 个 布尔 类 型 的 值 只 有 两 种 : true 和 false。if 和 for 语 句 的 条 件 部 分 都 是 布尔 类 型 的 值 ， 并 且 == 
和 < 等 比较 操作 也 会 产生 布尔 型 的 值 。 一 元 操作 符 ! 对 应 逻辑 非 操 作 ， 因 此 !true 的 值 

A false ， 更 罗 味 的 说 法 是 (Itrue==false)==true ， 虽 然 表 达 方 式 不 一 样 ， 不 过 我 们 一 般 会 
采用 简洁 的 布尔 表达 式 ， 就 像 用 X 来 表示 xtrue ° 


布尔 值 可 以 和 && (AND) 和 || (OR) 操作 符 结 合 ， 并 且 可 能 
值 已 经 可 以 确定 整个 布尔 表达 式 的 值 ， 那 么 运算 符 右边 的 值 ; 
式 总 是 安全 的 : 。 


会 有 短路 行为 : 如 果 运算 符 左 边 
将 不 在 被 求 值 ， 因 此 下 面 的 表达 


Sl ee sio] == tx! 


其 中 s[0] 操 作 如 果 应 用 于 空 字符 串 将 会 导致 panic 异 常 。 


AA aa 的 优先 级 比 || 高 〈 助 记 : 8 对 应 逻辑 乘法 ，|| 对 应 逻辑 加 法 ， 乘 法 比 加 法 优先 
级 要 高 ) ， 下 面 形式 的 布尔 表达 式 是 不 需要 加 小 括 弧 的 : 


if 'a' <= c &&c <= 'z' || 
"A' <= c && c <= 'Z' || 
'0' <= c && c <= '9' { 
V no ANSGIMIY etter on Lot 


布尔 值 并 不 会 隐 式 转换 为 数字 值 0 或 1， 反之 亦 然 。 必 须 使 用 一 个 显 式 的 if 语 名 辅助 转换 : 


i= 0 
if b { 

i=1 
} 


如 果 需 要 经 常 做 类 似 的 转换 ,包装 成 一 个 函数 会 更 方便 : 


// DEOL returns 1 if b is crue and Orif false: 
func btoi(b bool) int { 
if b { 
returne 


} 


return 0 


数字 到 布尔 型 的 逆转 换 则 非常 简单 , 不 过 为 了 保持 对 称 , 我 们 也 可 以 包装 一 个 函数 : 


// itob reports whether i is non-zero. 
func itob(i int) bool { return i != 0 } 


99 


3.5. 字符 串 


一 个 字符 串 是 一 个 不 可 改变 的 字 节 序 列 。 字 符 串 可 以 包含 任意 的 数据 ， 包 括 byte 值 0， 但 是 通 
常 是 用 来 包含 人 类 可 读 的 文本 。 文 本 字符 串通 常 被 解释 为 采用 UTF8 编 码 的 Unicode 码 点 
(rune) 序列 ， 我 们 稍 后 会 详细 讨论 这 个 问题 。 


内 置 的 len 函 数 可 以 返回 一 个 字符 串 中 的 字 节 数 目 (不 是 rune 字 符 数目 ) ， 索 引 操作 s[i] 返 回 第 
个 字 节 的 字 节 值 ，i 必 须 满足 0 < i< len(s)K 42) R © 


s := "hello, world" 
fmt.Println(len(s)) ip Nile 
fmt.Println(s[0], s[7]) // "104 119" ('h' and 'w') 


如 果 试 图 访问 超出 字符 串 索 引 范 围 的 字 节 将 会 导致 panic 异 常 : 

c := s[len(s)] // panic: index out of range 
第 i 个 字 节 并 不 一 定 是 字符 串 的 第 i 个 字符 ， 因 为 对 于 非 ASCII 字 符 的 UTF8 编 码 会 要 两 个 或 多 个 
字 节 。 我 们 先 简单 说 下 字符 的 工作 方式 。 


子 字符 囊 操 作 s[ij] 基 于 原始 的 s 字 符 囊 的 第 i 个 字 节 开始 到 第 j 个 字 节 (并 不 包含 本身) 生成 一 
个 新 字符 串 。 生 成 的 新 字符 串 将 包含 j-i 个 字 节 。 


fmt.Println(s[0:5]) // "hello" 


同样 ， 如 果 索 引 超出 字符 串 范围 或 者 j 小 于 i 的 话 将 导致 panic 蜡 常 。 


不 管 | 还 是 j 都 可 能 被 忽略 ， 当 它们 被 忽略 时 将 采用 0 作为 开始 位 置 ， 采 用 len(s) 作 为 结束 的 位 
oe 


fmt.Println(s[:5]) /7 "hello" 
fmt.Println(s[7:]) // "world" 
fmt.Println(s[:]) //7 "hello, world" 


其 中 + 操作 符 将 两 个 字符 串 链接 构造 一 个 新 字符 串 : 
fmt.Println("goodbye" + s[5:]) // "goodbye, world" 


字符 串 可 以 用 == 和 < 进行 比较 ; 比较 通过 逐个 字 节 比 较 完成 的 ， 因 此 比较 的 结 Fi FAR 
编码 的 顺序 。 


字符 串 的 值 是 不 可 变 的 : 一 个 字符 囊 包含 的 字 节 序列 永远 不 会 被 改变 ， 当 然 我 们 也 可 以 给 一 
个 字符 串 变量 分 配 一 个 新 字符 串 值 。 可 以 像 下 面 这 样 将 一 个 字符 串 追 加 到 另 一 个 字符 串 : 


S := "left foot" 
t := S 
s +=", right foot" 


这 并 不 会 导致 原始 的 字符 囊 值 被 改变 ， 但 是 变量 s 将 因为 += 语 句 持 有 一 个 新 的 字符 囊 值 ， 但 是 
t 依 然 是 包含 原先 的 字符 囊 值 。 


fmt.Println(s) // "left foot, right foot" 
fmt.Printin(t) // "left foot" 


因为 字符 串 是 不 可 修改 的 ， 因 此 尝试 修改 字符 串 内 部 数据 的 操作 也 是 被 禁止 的 : 


sto = 'L' // compile error: cannot assign to siol 


不 变性 意味 如 果 两 个 字符 串 共享 相同 的 底层 数据 的 话 也 是 安全 的 ， 这 使 得 复制 任何 长 度 的 字 
符 串 代价 是 低廉 的 。 同 样 ， 一 个 字符 串 s 和 对 应 的 子 字符 串 切 片 s[7:] 的 操作 也 可 以 安全 地 共享 
相同 的 内 存 ， 因 此 字符 串 切 片 操 作 代 价 也 是 低廉 的 。 在 这 两 种 情况 下 都 没有 必要 分 配 新 的 内 
存 。 图 3.4 演 示 了 一 个 字符 串 和 两 个 字 串 共享 相同 的 底层 数据 。 


3.5.1. 字符 串 面 值 


字符 串 值 也 可 以 用 字符 串 面值 方式 编写 ， 只 要 将 一 系列 字 节 序列 包含 在 双 引 号 即 可 : 


"Hello, 世界 " 


BREE Sasa s 





s := “hello, world" 
hello := s[:5] 


world := s[7:] 


Figure 3.4. The string "hello, world" and two substrings. 


因为 Go 语言 源 文 件 总 是 用 UTF8 编 码 ， 并 且 Go 语 言 的 文本 字符 串 也 以 UTF8 编 码 的 方式 处 理 ， 
此 我 们 可 以 将 Unicode 码 点 也 写 到 字符 串 面 值 中 。 


在 一 个 双 引 号 包含 的 字符 串 面 值 中 ， 可 以 用 以 反 斜 枉 \ 开头 的 转 义 序列 插入 任意 的 数据 。 下 
面 的 换行 、 | 表 符 等 是 常见 的 ASCII 控 制 代码 的 转 义 方式 : 


Na 响 铃 
\b 退 格 
\f 换 页 
\n 换行 
\r 回 车 
\t 制 表 符 
\v EHR 
\! 单 引 号 (只 用 在 '\'' 形式 的 rune 符 号 面值 中 ) 
Nu 双 引 号 (只 用 在 "1.1" 形式 的 字符 串 面 值 中 ) 
\\ BETI 
可 以 通过 十 六 进 制 或 和 八进制 转 义 在 字符 串 面值 包含 任意 的 字 节 。 一 个 十 六 进 制 的 转 义 形式 是 


\xhh， 其 中 两 个 h 表 示 十 六 进 制 数 字 ree peat 。 一 个 八进制 转 义 形式 是 \o00， 包 
含 三 个 和 八进制 的 0 数字 (0 到 7) ， 但 是 不 能 超过 \377 (译注 : 对 应 一 个 字 节 的 范围 ， 十 进 制 
为 255) 。 每 一 个 单一 的 字 节 表达 一 个 特定 的 值 。 稍 后 我 们 将 看 到 如 何 将 一 个 Unicode 码 点 写 
到 字符 串 面值 中 。 

一 个 原生 的 字符 串 面 值 形式 是 ... ， 使 用 反 引 号 代替 双 引 号 。 在 原生 的 字符 串 面值 中 ， 没 有 转 义 操作 ; 全 
部 的 内 容 都 是 字面 的 意思 ， 包 含 退 格 和 换行 ， 因 此 一 个 程序 中 的 原生 字符 串 面值 可 能 跨越 多 行 (译注 : 在 原生 字符 串 面值 内 
部 是 无 法 直接 写 字符 的 ， 可 以 用 八进制 或 十 六 进 制 转 义 或 +" "链接 字符 串 常 量 完成 ) 。 唯 一 的 
特殊 处 理 是 会 删除 回 车 以 保证 在 所 有 平台 上 的 值 都 是 一 样 的 ， 包 括 那些 把 回 车 也 放 入 文本 文 
件 的 系统 (译注 : Windows 系 统 会 把 回 车 和 换行 一 起 放 入 文本 文件 中 ) 。 


原生 字符 串 面 值 用 于 编写 正则 表达 式 会 很 方便 ， 因 为 正则 表达 式 往 往 会 包含 很 多 反 斜 杠 。 原 
生字 符 串 面值 同时 被 广泛 应 用 于 HTML 模 板 、JSON 面 值 、 命 令 行 提 示 信 息 以 及 那些 需要 扩展 
到 多 行 的 场景 。 


const GoUsage = `Go is a tool for managing Go source code. 


Usage: 
go command [arguments] 


3.5.2. Unicode 


在 很 久 以 前 ， 世 界 还 是 比较 简单 的 ， 起 码 计 算 机 世界 就 只 有 一 个 ASCII 字 符 集 : 美国 信息 交换 
标准 代码 。ASCII， 更 准确 地 说 是 美国 的 ASCII， 使 用 7bit 来 表示 128 个 字符 : 包含 英文 字母 的 
大 小 写 、 数 字 、 各 种 标点 符号 和 设置 控制 符 。 对 于 早期 的 计算 机 程序 来 说 ， 这 些 就 足够 了 ， 
但 是 这 也 导致 了 世界 上 很 多 其 他 地 区 的 用 户 无 法 直接 使 用 自己 的 符号 系统 。 随 着 互联 网 的 发 


展 ， 混 合 多 种 语言 的 数据 变 得 很 常见 (译注 : 比如 本 身 的 英文 原文 或 中 文 翻 译 都 包含 了 
ASCII、 中 文 、 日 文 等 多 种 语言 字符 ) 。 如 何 有 效 处理 这 些 包含 了 各 种 语言 的 丰富 多 样 的 文本 
数据 呢 ? 


答案 就 是 使 用 Unicode ( http:Wunicode.org ) ， 它 收集 了 这 个 世界 上 所 有 的 符号 系统 ， 包 括 
重音 符号 和 其 它 变 音符 号 ， 制 表 符 和 回 车 符 ， 还 有 很 多 神秘 的 符号 ， 每 个 符号 都 分 配 一 个 唯 
一 的 Unicode 码 点 ，Unicode 码 点 对 应 Go 语言 中 的 rune 整 数 类 型 (译注 : rune 是 int32 等 价 类 


型 ) 。 


在 第 八 版 本 的 Unicode 标 准 收集 了 超过 120,000 个 字符 ， 涵 盖 超 过 100 多 种 语言 。 这 些 在 计算 
机 程序 和 数据 中 是 如 何 体现 的 呢 ? 通用 的 表示 一 个 Unicode 码 点 的 数据 类 型 是 int32， 也 就 是 
Go 语言 中 rune 对 应 的 类 型 ; 它 的 同义词 rune 符 文正 是 这 个 意思 。 


我 们 可 以 将 一 个 符 文 序列 表示 为 一 个 int32 序 列 。 这 种 编码 方式 叫 UTF-32 或 UCS-4， 每 个 
Unicode 码 点 都 使 用 同样 的 大 小 32bit 来 表示 。 这 种 方式 比较 简单 统一 ， 但 是 它 会 浪费 很 多 存储 
空间 ， 因 为 大 数据 计算 机 可 读 的 文本 是 ASCII 字 符 ， 本 来 每 个 ASCII 字 符 只 需要 8bit 或 1 字 节 就 
能 表示 。 而且 即使 是 常用 的 字符 也 远 少 于 65,536 个 ， 也 就 是 说 用 16bit 编 码 方式 就 能 表达 常用 
字符 。 但 是 ， 还 有 其 它 更 好 的 编码 方法 吗 ? 


3.5.3. UTF-8 


UTF8 是 一 个 将 Unicode 码 点 编码 为 字 节 序列 的 变 长 编码 。UTF8 编 码 由 Go 语言 之 父 Ken 
Thompson 和 Rob Pike 共 同 发 明 的 ， 现 在 已 经 是 Unicode 的 标准 。UTF8 编 码 使 用 1 到 4 个 字 节 
来 表示 每 个 Unicode 码 点 ，ASCII 部 分 字符 只 使 用 1 个 字 节 ， 常 用 字符 部 分 使 用 2 或 3 个 字 节 表 
示 。 每 个 符号 编码 后 第 一 个 字 节 的 高 端 bit 位 用 于 表示 总 共有 多 少 编码 个 字 节 。 如 果 第 一 个 字 
节 的 高 端 bit 为 0， 则 表示 对 应 7bit 的 ASCII 字 符 ，ASCII 字 符 每 个 字符 依然 是 一 个 字 节 ， 和 传统 
的 ASCII 编 码 兼 容 。 如 果 第 一 个 字 节 的 高 端 bit 是 110， 则 说 明 需 要 2 个 字 节 ; 后 续 的 每 个 高 端 bit 
都 以 {10 开 头 。 更 大 的 Unicode 码 点 也 是 采用 类 似 的 策略 处 理 。 


OXXXXXXX runes 0-127 (ASCIT) 
110XXXXX 10XXXXXX 128-2047 (values <128 unused) 
1110xxxx 10XXXXXX 10XXXXXX 2048-65535 (values <2048 unused) 


11110xxx 10XXXXXX 10XXXXXX 10xxxxxx 65536-0x10ffff (other values unused) 


变 长 的 编码 无 法 直接 通过 索引 来 访问 第 n 个 字符 ， 但 是 UTF8 编 码 获得 了 很 多 额外 的 优点 。 首 
先 UTF8 编 码 比 较 紧凑 ， 完 全 兼容 ASCIl 码 ， 并 且 可 以 自动 同步 : 它 可 以 通过 向 前 回 朔 最 多 2 个 
字 节 就 能 确定 当前 字符 编码 的 开始 字 节 的 位 置 。 它 也 是 一 个 前 级 编码 ， 所 以 当 从 左 向 右 解 码 
时 不 会 有 任何 歧义 也 并 不 需要 向 前 查看 (译注 : 像 GBK 之 类 的 编码 ， 如 果 不 知道 起 点 位 置 则 
可 能 会 出 现 歧义 ) 。 没 有 任何 字符 的 编码 是 其 它 字符 编码 的 子囊 ， 或 是 其 它 编码 序列 的 字 

串 ， 因 此 搜索 一 个 字符 时 只 要 搜索 它 的 字 节 编码 序列 即 可 ， 不 用 担心 前 后 的 上 下 文 会 对 搜索 


结果 产生 干扰 。 同 时 UTF8 编 码 的 顺序 和 Unicode 码 点 的 顺序 一 致 ， 因 此 可 以 直接 排序 UTF8 编 
码 序列 。 同 时 因为 没有 总 入 的 NUL(0) 字 节 ， 可 以 很 好 地 兼容 那些 使 用 NUL 作 为 字符 串 结 尾 的 


编程 语言 。 


Go 语言 的 源 文件 采用 UTF8 编 码 ， 并 且 Go 语 言 处 理 UTF8 编 码 的 文本 也 很 出 色 。unicode 包 提 
BET iS Brune fF HKD AY BR (比如 区 分 字母 和 数组 ， 或 者 是 字母 的 大 写 和 小 写 转 
换 等 ) ，unicode/utf8 包 则 提供 了 用 于 rune 字 符 序 列 的 UTF8 编 码 和 解码 的 功能 。 


有 很 多 Unicode 字 符 很 难 直接 从 键盘 输入 ， 并 且 还 有 很 多 字符 有 着 相似 的 结构 ; 有 一 些 甚 至 是 
不 可 见 的 字符 (译注 : 中 文 和 日 文 就 有 很 多 相似 但 不 同 的 字 ) 。Go 语 言 字 符 串 面值 中 的 
Unicode 转 义 字 符 让 我 们 可 以 通过 Unicode 码 点 输入 特殊 的 字符 。 有 两 种 形式 : \uhhhh 对 应 
16bit 的 码 点 值 ，\Uhhhhhhhh 对 应 32bit 的 码 点 值 ， 其 中 h 是 一 个 十 六 进 制 数字 ; 一 般 很 少 需要 
使 用 32bit 的 形式 。 每 一 个 对 应 码 点 的 UTF8 编 码 。 例 如 : 下 面 的 字母 串 面 值 都 表示 相同 的 值 : 


"HJ" 
"\xe4\xb8\x96\xe7\x95\x8c" 
"\u4e16\u754c" 
"\U00004e16\U0000754c" 


上 面 三 个 转 义 序列 都 为 第 一 个 字符 串 提供 替代 写法 ， 但 是 它们 的 值 都 是 相同 的 。 


Unicode 转 义 也 可 以 使 用 在 rune 字 符 中 。 下 面 三 个 字符 是 等 价 的 : 


' 世 ' '\u4e16' '\U00004e16' 


对 于 小 于 256 码 点 值 可 以 写 在 一 个 十 六 进 制 转 义 字 节 中 ， 例 如 X41' 对 应 字符 'A'， 但 是 对 于 更 
大 的 码 点 则 必须 使 用 \U 或 \U 转 义 形式 。 因 此 ，"\xe4\xb8\x96' 并 不 是 一 个 合法 的 rune 字 符 ， 虽 然 
这 三 个 字 节 对 应 一 个 有 效 的 UTF8 编 码 的 码 点 。 


得 益 于 UTF8 编 码 优 良 的 设计 ， 诸 多 字符 串 操 作 都 不 需要 解码 操作 。 我 们 可 以 不 用 解码 直接 测 


试 一 个 字符 串 是 否 是 另 一 个 字符 串 的 前 组 : 


func HasPrefix(s, prefix string) bool { 
return len(s) >= len(prefix) && s[:len(prefix)] == prefix 


} 


或 者 是 后 组 测试 : 


func HasSuffix(s, suffix string) bool { 
return len(s) >= len(suffix) && s[len(s)-len(suffix):] == suffix 


} 


或 者 是 包含 子囊 测试 : 


func Contains(s, substr string) bool { 
for i g= 0; 1 < len(s); it+ { 
if HasPrefix(s[i:], substr) { 
return enue 
} 
} 


return false 


对 于 UTF8 编 码 后 文本 的 处 理 和 原始 的 字 节 处 理 逻 辑 是 一 样 的 。 但 是 对 应 很 多 其 它 编码 则 并 不 
是 这 样 的 。 (上 面 的 函数 都 来 自 strings 字 符 串 处 理 包 ， 丨 实 的 代码 包含 了 一 个 用 哈 希 技术 优 
化 的 Contains 实现 。) 


另 一 方面 ， 如 果 我 们 真 的 关心 每 个 Unicode 字 符 ， 我 们 可 以 使 用 其 它 处 理 方 式 。 考 虑 前 面 的 第 


一 个 例子 中 的 字符 串 ， 它 包 混 合 了 中 西 两 种 字符 。 图 3.5 展 示 了 它 的 内 存 表示 形式 。 字 符 串 包 
含 13 个 字 节 ， 以 UTF8 形 式 编码 ， 但 是 只 对 应 9 个 Unicode 字 符 : 


import "unicode/utf8" 
s := "Hello, #3" 


fmt.Println(len(s)) tide “Sale 
fmt.Println(utf8.RuneCountInString(s)) // "9" 


为 了 处 理 这 些 丨 实 的 字符 ， 我 们 需要 一 个 UTF8 解 码 器 。unicode/utf8 包 提供 了 该 功能 ， 我 们 
可 以 这 样 使 用 : 


for i := 0; i < len(s); { 
r, size := utf8.DecodeRuneInString(s[i:]) 
fmt.Printf("%d\t%c\n", i, r) 
i += size 

} 


每 一 次 调用 DecodeRunelnString 有 函数 都 返回 一 个 r 和 长 度 ，r 对 应 字符 本 身 ， 长 度 对 应 r 采 用 
UTF8 编 码 后 的 编码 字 节 数目 。 长 度 可 以 用 于 更 新 第 i 个 ee 但 是 
这 种 编码 方式 是 笨拙 的， 我 们 需要 更 简洁 的 语法 。 幸 运 的 是 ，Go 语 言 Se eee 
串 的 时 候 ， 会 自动 隐 式 解码 UTF8 字 符 串 。 下 面 的 循环 运行 如 图 3.5 所 示 ; 需要 注意 的 是 对 于 非 
ASCIl， 索 引 更 新 的 步 长 将 超过 1 个 字 节 。 
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"Hello, ER" 


for i, r := range "Hello, ËR" { 
fmt.Printf("%d\t%q\t%d\n", i, r, r) 


PN OU PWN Fe Or 


} 


Figure 3.5. A range loop decodes a UTF-8-encoded string. 


for i, r := range "Hello, +A" { 
fmt.Printf("%d\t%q\t%d\n", i, r, r) 


我 们 可 以 使 用 一 个 简单 的 循环 来 统计 字符 串 中 字符 的 数目 ， 像 这 样 : 


mM = o 

for _, _= range s { 
n+ 十 

} 


像 其 它 形式 的 循环 那样 ， 我 们 也 可 以 忽略 不 需要 的 变量 : 


n := 0 
for range s { 
n++ 


} 


或 者 我 们 可 以 直接 调用 utf8.RuneCountInString(s) 元 数 。 


正如 我 们 前 面 提 到 的 ， ae ea Eee a Ne) See 
并 不 是 一 个 惯例 ， 这 是 正确 的 。 如 果 用 于 循环 的 字符 串 只 是 一 个 普通 的 二 进 制 数 据 ， 或 者 是 
含有 错误 编码 的 UTF8 数 据 ， 将 会 发 送 什么 呢 ? 


每 一 个 UTF8 字 符 解 码 ， 不 管 是 显 式 地 调用 utf8.DecodeRunelnString 解 码 或 是 在 range 循 环 中 
隐 式 地 解码 ， 如 果 遇 到 一 个 错误 的 UTF8 编 码 输入 ， 将 生成 一 个 特别 的 Unicode 字 符 \uFFFD' ， 
在 印刷 中 这 个 符号 通常 是 一 个 黑色 六 角 或 钻石 形状 ， 里 面包 含 一 个 白色 的 问号 " 仿 "。 当 程序 遇 


到 这 样 的 一 个 字符 ， 通 常 是 一 个 危险 信号 ， 说 明 输 入 并 不 是 一 个 完美 没有 错误 的 UTF8 字 符 
Bo 


UTF8 字 符 串 作为 交换 格式 是 非常 方便 的 ， 但 是 在 程序 内 部 采用 rune 序 列 可 能 更 方便 ， 因 为 
rune 大 小 一 致 ， 支 持 数 组 索引 和 方便 切割 。 


string 接 受到 []rune 的 类 型 转换 ， 可 以 将 一 个 UTF8 编 码 的 字符 串 解 码 为 Unicode 字 符 序 列 : 


// "program" in Japanese katakana 

SG go Vergo pA 

fmt. iPranth("% Xni S) // “es 83 97 e383 ad\ e3 82 bO e3 83 a9 e3 83 ao” 
r := []rune(s) 

fmt.Printf("%x\n", r) // "[30d7 30ed 30b0 30e9 30e0]" 


(在 第 一 个 Printf 中 的 % x 参数 用 于 在 每 个 十 六 进 制 数字 前 插入 一 个 空格 。) 


如 果 是 将 一 个 [rune 类 型 的 Unicode 字 符 slice 或 数组 转 为 string， 则 对 它们 进行 UTF8 编 码 : 


fmt.Println(string(r)) // "750774" 


将 一 个 整数 转型 为 字符 串 意思 是 生成 以 只 包含 对 应 Unicode 码 点 字符 的 UTF8 字 符 串 : 


fmt.Println(string(65)) Hie N OE SD 
fmt.Println(string(0x4eac)) // "z" 


如 果 对 应 码 点 的 字符 是 无 效 的 ， 则 用 \uFFFD' 无 效 字 符 作 为 替换 : 


fmt.Println(string(1234567)) // "@" 


3.5.4. 字符 串 和 Byte 切 片 


标准 库 中 有 四 个 包 对 字符 串 处 理 尤 为 重要 : bytes、strings、strconv 和 unicode 包 。strings 色 
提供 了 许多 如 字符 串 的 查询 、 和 替换 、 上 比较、 截断 、 拆 分 和 合并 等 功能 。 


bytes 包 也 提供 了 很 多 类 似 功能 的 函数 ， 但 是 针对 和 字符 串 有 着 相同 结构 的 []jbyte 类 型 。 因 为 字 
符 串 是 只 读 的 ， 因 此 逐步 构建 字符 串 会 导致 很 多 分 配 和 复制 。 在 这 种 情况 下 ， 使 用 
bytes.Buffer 类 型 将 会 更 有 效 ， 稍 后 我 们 将 展示 。 


strconv 包 提供 了 布尔 型 、 整 型 数 、 浮 点 数 和 对 应 字符 串 的 相互 转换 ， 还 提供 了 双 引 号 转 义 相 
关 的 转换 。 


unicode 包 提供 了 IsDigit、IsLetter、lsUpper 和 IsLower 等 类 似 功 能 ， 它 们 用 于 给 字符 分 类 。 每 
个 函数 有 一 个 单一 的 rune 类 型 的 参数 ， 然 后 返回 一 个 布尔 值 。 而 像 ToUpper 和 ToLower 之 类 的 
转换 函数 将 用 于 rune 字 符 的 大 小 写 转 换 。 所 有 的 这 些 函 数 都 是 遵循 Unicode 标 准 定义 的 字母 、 


数字 等 分 类 规范 。strings 包 也 有 类 似 的 函数 ， 它 们 是 ToUpper 和 ToLower， 将 原始 字符 串 的 每 
个 字符 都 做 相应 的 转换 ， 然 后 返回 新 的 字符 串 。 


下 面 例子 的 basename 函 数 灵 感 于 Unix shell 的 同名 工具 。 在 我 们 实现 的 版 本 中 ，basename(s) 
将 看 起 来 像 是 系统 路 径 的 前 缓 删除 ， 同 时 将 看 似 文件 类 型 的 后 缓 名 部 分 删除 : 


fmt .Println(basename("a/b/c.go")) // "c" 
fmt .Println(basename("c.d.go")) Hi MS (ol™ 
fmt .Println(basename("abc")) /labey 


第 一 个 版 本 并 没有 使 用 任何 库 ， 全 部 手工 硬 编码 实现 : 
gopl.io/ch3/basename1 


// basename removes directory components and a .suffix. 
// e.g., a => a, a.go => a, a/b/c.go => c, a/b.c.go => b.c 
func basename(s string) string { 

// Discard last '/' and everything before. 


for i := len(s) - 1; i >= 0; i-- { 
if s[i] == '/' { 
s = s[iti:] 
break 
} 
} 
// Preserve everything before last '.'. 
for i := len(s) - 1; i >= 0; i-- { 
if s[i] == '.' { 
s = s[:i] 
break 
} 
} 
return s 


简化 个 版 本 使 用 了 strings.Lastlndex 库 函数 : 


gopl.io/ch3/basename2 


func basename(s string) string { 
slash := strings.LastIndex(s, "/") // -1 if "/" not found 
s = s[slash+i:] 


if dot := strings.LastIndex(s, "."); dot >= 0 { 
s = s[:dot] 

} 

return s 


path 和 path/filepath 包 提供 了 关于 文件 路 径 名 更 一 般 的 函数 操作 。 使 用 斜 杠 分 隔 路 径 可 以 在 任 
何 操作 系统 上 工作 。 斜 杠 本 身 不 应 该 用 于 文件 名 ， 但 是 在 其 他 一 些 领域 可 能 会 用 于 文件 名 ， 
例如 URL 路 径 组 件 。 相 比 之 下 ，path/filepath 包 则 使 用 操作 系统 本 身 的 路 径 规 则 ， 例 如 POSIX 
系统 使 用 /foo/bar， 而 Microsoft Windows 使 用 ci:\foo\bar 等 。 


让 我 们 继续 另 一 个 字符 串 的 例子 。 函 数 的 功能 是 将 一 个 表示 整 值 的 字符 串 
入 一 个 各 号 分 隔 符 ， 例 如 “12345” 处 理 后 成 为 “12,345”。 这 个 版 本 只 适用 于 整数 类 型 ; 支持 浮 
点 数 类 型 的 支持 留 作 练 习 。 


gopl.io/ch3/comma 


// comma inserts commas in a non-negative decimal integer string. 


func comma(s string) string { 


n := len(s) 
if n <=3 { 

return s 
} 


return comma(s[:n-3]) + "," + s[n-3:] 


4 Acomma 8 2k 4) RAN FA Bo HOR AMAF HE BM RR DT RET OIE URE RG 
入 运 分 隔 符 。 否 则 ，comma 函 数 将 在 最 后 三 个 字符 前 位 置 将 字符 串 切 割 为 两 个 两 个 子 串 并 插 
入 过 号 分 隔 符 ， 然 后 通过 递归 调用 自身 来 出 前 面 的 子囊 。 


一 个 字符 串 是 包含 的 只 读 字 节 数 组 ， 一 旦 创建 ， 是 不 可 变 的 。 相 比 之 下 ， 一 个 字 节 gslice 的 元 
素 则 可 以 自由 地 修改 。 


字符 串 和 字 节 slice 之 问 可 以 相互 转换 : 


s := "abc" 
b := []byte(s) 
s2 := string(b) 


从 概念 上 讲 ， 一 个 [Jbyte(s) 转 换 是 分 配 了 一 个 新 的 字 节 数组 用 于 保存 字符 串 数据 的 拷贝 ， 然 后 
引用 这 个 底层 的 字 节 数组 。 编 译 器 的 优化 可 以 避免 在 一 些 场景 下 分 配 和 复制 字符 串 数 据 ， 但 
总 的 来 说 需要 确保 在 变量 b 被 修改 的 情况 下 ， 原 始 的 Ss 字符 串 也 不 会 改变 。 将 一 个 字 节 slice 转 
到 字符 串 的 string(b) 操 作 则 是 构造 一 个 字符 串 找 贝 ， 以 确保 S2 字 符 囊 是 只 读 的 。 


为 了 避免 转换 中 不 必要 的 内 存 分 配 ，bytes 包 和 strings 同 时 提供 了 许多 实用 函数 。 下 面 是 
strings 包 中 的 六 个 函数 : 


func Contains(s, substr string) bool 
func Count(s, sep string) int 

func Fields(s string) []string 

func HasPrefix(s, prefix string) bool 
func Index(s, sep string) int 

func Join(a []string, sep string) string 


bytes 包 中 也 对 应 的 六 个 函数 : 


func Contains(b, subslice []byte) bool 
func Count(s, sep []byte) int 

func Fields(s []byte) [][]byte 

func HasPrefix(s, prefix []byte) bool 
func Index(s, sep []byte) int 

func Join(s [][]byte, sep []byte) []byte 


它们 之 间 唯 一 的 区 别 是 字符 串 类 型 参数 被 替换 成 了 字 节 gslice 类 型 的 参数 。 


bytes 包 还 提供 了 Buffer 类 型 用 于 字 节 slice 的 缓存 。 一 个 Buffer 开 始 是 空 的 ， 但 是 随 着 string、 
byte 或 []byte 等 类 型 数据 的 写 入 可 以 动态 增长 ， 一 个 bytes.Buffer 变 量 并 不 需要 处 理化 ， 因 为 零 
值 也 是 有 效 的 : 


gopl.io/ch3/printints 


// intsToString is like fmt.Sprint(values) but adds commas. 
func intsToString(values []Jint) string { 
var buf bytes.Buffer 
buf.WriteByte('[') 
for i, v := range values { 
if 17> 0 { 
buf .WriteString(", ") 
} 
fmt.Forintf(&buf, "%d", v) 
} 
buf .writeByte(']') 
return buf.String() 


func main() { 
fmt.Println(intsToString([]Jint{i, 2, 3})) // "[4, 2, 3]" 
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当 向 bytes.Buffer 添 加 任意 字符 的 UTF8 编 码 时 ， 最 好 使 用 bytes.Buffer 的 WriteRune 方 法 ， 但 是 
WriteByte 方 法 对 于 写 入 类 似 由 和 由 等 ASCII 字 符 则 会 更 加 有 效 。 


bytes.Buffer 类 型 有 着 很 多 实用 的 功能 ， 我 们 在 第 七 章 讨 论 接 口 时 将 会 涉及 到 ， 我 们 将 看 看 如 
何 将 它 用 作 一 个 JO 的 输入 和 输出 对 象 ， 例 如 当做 Fprintf 的 io.Writer 输 出 对 象 ， 或 者 当 作 
io.Reader 类 型 的 输入 源 对 象 。 


练习 3.10 : 编写 一 个 非 递 归 版 本 的 comma 函 数 ， 使 用 bytes.Buffer 代 替 字 符 串 链接 操作 。 
练习 3.11 : 完善 comma 坊 数 ， 以 支持 浮 点 数 处 理 和 一 个 可 选 的 正 负 号 的 处 理 。 

练习 3.12 : 编写 一 个 函数 ， 判 断 两 个 字符 囊 是 否 是 是 相互 打 乱 的 ， 也 就 是 说 它们 有 着 相同 的 
字符 ， 但 是 对 应 不 同 的 顺序 。 

3.5.5. 字符 串 和 数字 的 转换 


除了 字符 串 、 字 符 、 字 节 之 间 的 转换 ， 字 符 串 和 数值 之 间 的 转换 也 比较 常见 。 由 strconv 包 提 
供 这 类 转换 功能 。 


将 一 个 整数 转 为 字符 串 ， 一 种 方法 是 用 fmt.Sprintf 返 回 一 个 格式 化 的 字符 串 ; 另 一 个 方法 是 用 
strconv.ltoa(“ 整 数 到 ASCIP) : 


xX = 123 
y := fmt.Sprintf("%d", x) 
fmt.Println(y, strconv.Itoa(x)) // "123 123" 


Formatint4#FormatUint 2 2 T VA A R A 89 2 i] RAAF : 
fmt.Println(strconv.FormatInt(int64(x), 2)) // "1111011" 
fmt.Printf 245 %b ` Yd ` oF" Vx KAA) AEA 4 Hestrconv & 89 Format Bak 712 AR 
多 ， 特 别 是 在 需要 包含 附加 额外 信息 的 时 候 : 
s := fmt.Sprintf("x=%b", x) // "x=1111011" 


to RBG FH B A ABA > T VAS A strconv & 4 Atoi2.Parselnt Až > 28 A M TAHE 
HF EAH) Parsevint HH : 


x, err := strconv.Atoi("123") ME SR SS am elit 
y, err := strconv.ParseInt("123", 10, 64) // base 10, up to 64 bits 


Parselnt h ži HERBAL EBAHK-] ; 例如 16 表 示 int16，0 则 表示 int。 在 任何 
情况 下 ， 返 回 的 结果 y 总 是 int64 类 型 ， 你 可 以 通过 强制 类 型 转换 将 它 转 为 更 小 的 整数 类 型 。 


有 时 候 也 会 使 用 fmt.Scanf 来 解析 输入 的 字符 串 和 数字 ， 特 别 是 当 字 符 串 和 数字 混合 在 一 行 的 
时 候 ， 它 可 以 灵活 处 理 不 完整 或 不 规则 的 输入 。 
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3.6. 


常量 表达 式 的 值 在 编译 期 计算 ， 而 不 是 在 运行 期 。 每 种 常量 的 潜在 类 型 都 是 基础 类 型 : 
boolean、string 或 数字 。 


一 个 常量 的 声明 语句 定 义 了 常量 的 名 字 ， 和 变 atari 人 似 ， 常 量 的 值 不 可 修改 ， 
可 以 防止 在 运行 期 被 意外 或 恶意 的 修改 。 例 如 量 比 变量 更 适合 用 于 表达 像 T 之 类 的 数学 
数 ， 因 为 它们 的 值 不 会 发 生变 化 : 


const pi = 3.14159 // approximately; math.Pi is a better approximation 


和 变量 声明 一 样 ， 可 以 批量 声明 多 个 常量 ; 这 比较 适合 声明 一 组 相关 的 常量 : 


const ( 
e = 2.718281828459045235360287471352662497 75724709369995957496696 763 
pi = 3.14159265358979323846264338327950288419716939937510582097494459 


As 
当 操 作 数 是 常量 时 ， 一 些 运行 时 的 错误 也 可 以 在 编译 时 被 发 现 ， 例 如 整数 除 零 、 字 符 串 索引 
越界 、 任 何 导 致 无 效 浮 点 数 的 操作 等 


量 间 的 所 有 算术 运算 、 远 辑 运算 和 比较 运算 的 结果 也 是 常量 ， 对 常量 的 类 型 转换 操作 或 以 
be eet 量 结 果 : len > cap 、real、imag、complex 和 
unsafe.Sizeof (§13.1) ° 


因为 它们 的 值 是 在 编译 期 就 确定 的 ， 因 此 常量 可 以 是 构成 类 型 的 一 部 分 ， 例 如 用 于 指定 数组 
类 型 的 长 度 : 


const IPv4Len = 4 


// parseIPv4 parses an IPv4 address (d.d.d.d). 
func parseIPv4(s string) IP { 

var p [IPv4Len]byte 

LLAN: 


一 个 常量 的 声明 也 可 以 包含 一 个 类 型 和 一 个 值 ， 但 是 如 果 没 有 显 式 指明 类 型 ， 那 么 将 从 右边 
的 表达 式 推 断 类 型 。 在 下 面 的 代码 中 ，time.Duration 是 一 个 命名 类 型 ， 底 层 类 型 是 int64， 
time.Minute 是 对 应 类 型 的 常量 。 下 面 声 明 的 两 个 常量 都 是 time.Duration 类 型 ， 可 以 通过 %T 参 
数 打 印 类 型 信息 : 


const noDelay time.Duration = 0 

const timeout = 5 * time.Minute 

fmt.Printf("%T %[1]v\n", noDelay) // “time.Duration 0" 
fmt .Printf("%T %[1]v\n", timeout) // “time.Duration 5m0s" 
fmt .Printf("%T %[1]v\n", time.Minute) // "time.Duration im0s" 


如 果 是 批量 声明 的 常量 ， 除 了 第 一 个 外 其 它 的 常量 右边 的 初始 化 表达 式 都 可 以 省 略 ， 如 果 省 
略 初始 化 表达 式 则 表示 使 用 前 面 常量 的 初始 化 表达 式 写 法 ， 对 应 的 常量 类 型 也 一 样 的 。 例 


const ( 
a = 工 
b 
C= 这 
d 

) 


fmt.Println(a, b, c, d) // "1122" 


如 果 只 是 简单 地 复制 右边 的 常量 表达 式 ， 其 实 并 没有 太 实 用 的 价值 。 但 是 它 可 以 带 来 其 它 的 
特性 ， 那 就 是 iota 常 量 生成 器 语法 。 


3.6.1. iota 第 量 生成 器 


常量 声明 可 以 使 用 iota 常 量 生成 器 初始 化 ， 它 用 于 生成 一 组 以 相似 规则 初始 化 的 常量 ， 但 是 不 
用 每 行 都 写 一 人 遍 初 始 化 表达 式 。 在 一 个 const 声 明 语 名 中 ， 在 第 一 个 声明 的 常量 所 在 的 行 ， 
iota 将 会 被 置 为 0， 然 后 在 每 一 个 有 常量 声明 的 行 加 一 。 


下 面 是 来 自 time 包 的 例子 ， 它 首先 定义 了 一 个 Weekday 命 名 类 型 ， 然 后 为 一 周 的 每 天 定义 了 
一 个 常量 ， 从 周 日 0 开始 。 在 其 它 编程 语言 中 ， 这 种 类 型 一 般 被 称 为 枚 举 类 型 。 


type Weekday int 


const ( 

Sunday Weekday = iota 
Monday 

Tuesday 

Wednesday 

Thursday 

Friday 

Saturday 


周 日 将 对 应 0， 周 一 为 1， 如 此 等 等 。 


我 们 也 可 以 在 复杂 的 常量 表达 式 中 使 用 iota， 下 面 是 来 自 net 包 的 例子 ， 用 于 给 一 个 无 符号 吉 
数 的 最 低 5bit 的 每 个 bit 指 定 一 个 名 字 


type Flags uint 


cons 


t ( 

FlagUp Flags = 1 << iota // is up 

FlagBroadcast // supports broadcast access capability 
FlagLoopback // is a loopback interface 
FlagPointToPoint // belongs to a point-to-point link 
FlagMulticast // supports multicast access capability 


随 着 iota 的 递增 ， 每 个 常量 对 应 表达 式 1<< iota， 是 连续 的 2 的 等， 分 别 对 应 一 个 bit 位 置 。 使 
用 这 些 常量 可 以 用 于 测试 、 设 置 或 清除 对 应 的 bit 位 的 值 : 


gopl.io/ch3/netflag 


func 
func 
func 
func 


IsUp(v Flags) bool 
TurnDown(v *Flags) 
SetBroadcast(v *Flags) 
IsCast(v Flags) bool 


{ return v&FlagUp == FlagUp } 

{ *v &^= FlagUp } 

{ *v |= FlagBroadcast } 

{ return v&(FlagBroadcast|FlagMulticast) != 0 } 


unc main() { 


var v Flags = FlagMulticast | FlagUp 

fmt.Printf("%b %t\n", v, IsUp(v)) // "10001 true" 
TurnDown(&v) 

fmt.Printf("%b %t\n", v, IsUp(v)) // "10000 false" 
SetBroadcast(&v) 

fmt.Printf("%b %t\n", v, IsUp(v)) // "10010 false" 
fmt.Printf("%b %t\n", v, IsCast(v)) // "10010 true" 


Fame 2 RRO Fo ANH SMB 10240 : 


cons 


t( 


KiB // 
MiB // 
GiB // 
TiB // 
PiB // 
EiB // 
ZiB // 
YiB // 


= 1 << (10 * iota) 


1024 

1048576 

1073741824 

1099511627776 (exceeds 1 << 32) 
1125899906842624 

1152921504606846976 

1180591620717411303424 (exceeds 1 << 64) 
1208925819614629174706176 


不 过 iota 常 量 生成 规则 也 有 其 局 腿 性 。 例 如 ， 它 并 不 能 用 于 产生 1000 的 徊 (KB、MB 等 )， 因 
为 Go 语言 并 没有 计算 需 的 运算 符 。 


练习 3.13 : 编写 KB、MB 的 常量 声明 ， 然 后 扩展 到 YB 。 


3.6.2. 无 类 型 常量 


Go 语言 的 常量 有 个 不 同 寻常 之 处 。 虽 然 一 个 常量 可 以 有 任意 有 一 个 确定 的 基础 类 型 ， 例 如 int 
或 float64， 或 者 是 类 似 time.Duration 这 样 命名 的 基础 类 型 ， 但 是 许多 常量 并 没有 一 个 明确 的 
基础 类 型 。 编 译 器 为 这 些 没 有 明确 的 基础 类 型 的 数字 常量 提供 比 基 础 类 型 更 高 精度 的 算术 运 
算 ; 你 可 以 认为 至 少 有 256bit 的 运算 精度 。 这 里 有 六 种 未 明确 类 型 的 常量 类 型 ， 分 别 是 无 类 型 
的 布尔 型 、 无 类 型 的 整数 、 无 类 型 的 字符 、 无 类 型 的 浮 点 数 、 无 类 型 的 复数 、 无 类 型 的 字符 
Bo 


通过 延迟 明确 常量 的 具体 类 型 ， 无 类 型 的 常量 不 仅 可 以 提供 更 高 的 运算 精度 ， 而 且 可 以 直接 
用 于 更 多 的 表达 式 而 不 需要 显 式 的 类 型 转换 。 例 如 ， 例 子 中 的 ZiB 和 YiB 的 值 已 经 超出 任何 Go 
语言 中 整数 类 型 能 表达 的 范围 ， 但 是 它们 依然 是 合法 的 常量 ， 而 且 可 以 像 下 面 常量 表达 式 依 
RAB (译注 : YiB/ZiB 是 在 编译 期 计算 出 来 的 ， 并 且 结果 常量 是 1024， 是 Go 语言 int 变 量 能 
效 表 示 的 ) 


fmt.Println(YiB/ZiB) // "1024" 


另 一 个 例子 ，math.Pi 无 类 型 的 浮 点 数 常量 ， 可 以 直接 用 于 任意 需要 浮 点 数 或 复数 的 地 方 : 


var x float32 = math.Pi 
var y float64 = math.Pi 
var z complex128 = math.Pi 


如 果 math.Pi 被 确定 为 特定 类 型 ， 比 如 float64， 那 么 结果 精度 可 能 会 不 一 样 ， 同 时 对 于 需要 
float32 或 complex128 类 型 值 的 地 方 则 会 强制 需要 一 个 明确 的 类 型 转换 : 


const Pi64 float64 = math.Pi 


var x float32 = float32(Pi64) 
var y float64 = Pi64 
var z complex128 = complex128(Pi64) 


对 于 常量 面值 ， 不 同 的 写法 可 能 会 对 应 不 同 的 类 型 。 例 如 0、0.0、0i 和 "\u0000' 虽 然 有 着 相同 
的 常量 值 ， 但 是 它们 分 别 对 应 无 类 型 的 整数 、 无 类 型 的 浮 点 数 、 无 类 型 的 复数 和 无 关 型 的 字 
符 等 不 同 的 常量 类 型 。 同 样 ，true 和 false 也 是 无 类 型 的 布尔 类 型 ， 字 符 串 面值 常量 是 无 类 型 的 
字符 串 类 型 。 


前 面 说 过 除法 运算 符 /会 根据 操作 数 的 类 型 生成 对 应 类 型 的 结果 。 因 此 ， 不 同 写法 的 常量 除法 
表达 式 可 能 对 应 不 同 的 结果 : 


var f float64 = 212 

fmt.Println((f - 32) * 5 / 9) L000 (32 SY lS a floatea 
fmt.Println(5 / 9 * (f - 32)) Hip MO: 5/9 is an untyped integer, 0 
fmt.Println(5.0 / 9.0 * (f - 32)) // "100"; 5.0/9.0 is an untyped float 


只 有 常量 可 以 是 无 类 型 的 。 当 一 个 无 类 型 的 常量 被 赋值 给 一 个 变量 的 时 候 ， 就 像 上 面 的 第 一 
行 语句 ， 或 者 是 像 其 余 三 个 语句 中 右边 表达 式 中 含有 明确 类 型 的 值 ， 无 类 型 的 常量 将 会 被 隐 
式 转换 为 对 应 的 类 型 ， 如 果 转 换 合 法 的 话 。 


var f float64 = 3 + 0i // untyped complex -> float64 


f= 2 // untyped integer -> float64 
f = 1e123 // untyped floating-point -> float64 
f= tai // untyped rune -> float64 

上 面 的 语 名 相当 于 : 


var f float64 = float64(3 + 0i) 
f = float64(2) 

float64(1e123) 

float64('a') 
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无 论 是 隐 式 或 显 式 转换 ， 将 一 种 类 型 转换 为 另 一 种 类 型 都 要 求 目标 可 以 表示 原始 值 。 对 于 浮 
点 数 和 复数 ， 可 能 会 有 全 入 处 理 : 


const ( 

deadbeef = Oxdeadbeef // untyped int with value 3735928559 
= uint32(deadbeef) // uint32 with value 3735928559 
= float32(deadbeef) // float32 with value 3735928576 (rounded up) 
= float64(deadbeef) // float64 with value 3735928559 (exact) 
int32(deadbeef ) // compile error: constant overflows int32 
= float64(1e309) // compile error: constant overflows float64 
= uint(-1) // compile error: constant underflows uint 
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对 于 一 个 没有 显 式 类 型 的 变量 声明 语法 (包括 短 变 量 声明 语法 ) ， 无 类 型 的 常量 会 被 隐 式 转 
为 默认 的 变量 类 型 ， 就 像 下 面 的 例子 : 


0 // untyped integer; implicit int(0) 

"\000' // untyped rune; implicit rune('\000') 
0.0 // untyped floating-point; implicit float64(0.0) 
Oi // untyped complex; implicit complex128(0i) 
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注意 默认 类 型 是 规则 的 : 无 类 型 的 整数 常量 默认 转换 为 int， 对 应 不 确定 的 内 存 大 小 ， 但 是 浮 
点 数 和 复数 常量 则 默认 转换 为 float64 和 complex128。Go 语 言 本 身 并 没有 不 确定 内 存 大 小 的 浮 
点 数 和 复数 类 型 ， 而 且 如 果 不 知 道 浮 点 数 类 型 的 话 将 很 难 写 出 正确 的 数值 算法 。 


如 果 要 给 变量 一 个 不 同 的 类 型 ， 我 们 必须 显 式 地 将 无 类 型 的 常量 转化 为 所 需 的 类 型 ， 或 给 声 
明 的 变量 指定 明确 的 类 型 ， 像 下 面 例子 这 样 : 


var i = int8(0) 
var i int8 = 0 


当 尝 试 将 这 些 无 类 型 的 常量 转 为 一 个 接口 值 时 ( 见 第 7 章 ) ， 这 些 默认 类 型 将 显得 尤为 重要 ， 
因为 要 靠 它们 明确 接口 对 应 的 动态 类 型 。 


fmt.Printf("%T\n", 0) dp Maine 
fmt.Printf("%T\n", 0.0) // "float64" 
fmt.Printf("%T\n", 01) // “complexi28" 


fmt.Printf("%T\n", '\@00') // "int32" (rune) 


现在 我 们 已 经 讲述 了 Go 语言 中 全 部 的 基础 数据 类 型 。 下 一 步 将 演示 如 何 用 基础 数据 类 型 组 合 
成 数组 或 结构 体 等 复杂 数据 类 型 ， 然 后 构建 用 于 解决 实际 编程 问题 的 数据 结构 ， 这 将 是 第 四 
章 的 讨论 主题 。 


第 四 章 复合 数据 类 型 


在 第 三 章 我 们 讨论 了 基本 数据 类 型 ， 它 们 可 以 用 于 构建 程序 中 数据 结构 ， 是 Go 语言 的 世界 的 
原子 。 在 本 章 ， 我 们 将 讨论 复合 数据 类 型 ， 它 是 以 不 同 的 方式 组 合 基 本 类 型 可 以 构造 出 来 的 
复合 数据 类 型 。 我 们 主要 讨论 四 种 类 型 一 一 数组 、slice、map 和 结构 体 同时 在 本 章 的 最 
后 ， 我 们 将 演示 如 何 使 用 结构 体 来 解码 和 编码 到 对 应 JSON 格 式 的 数据 ， 并 且 通 过 结合 使 用 模 
板 来 生成 HTML 页 面 。 





数组 和 结构 体 是 聚合 类 型 ; 它们 的 值 由 许多 元 素 或 成 员 字段 的 值 组 成 。 数 组 是 由 同 构 的 元 素 
组 成 一 每 个 数组 元 素 都 是 完全 相同 的 类 型 一 “结构 体 则 是 由 异 构 的 元 素 组 成 的 。 数 组 和 结 
构 体 都 是 有 固定 内 存 大 小 的 数据 结构 。 相 比 之 下 ，slice 和 map 则 是 动态 的 数据 结构 ， 它 们 将 
根据 需要 动态 增长 。 








4.1. 数组 


数组 是 一 个 由 国定 长 度 的 特定 类 型 元 素 组 成 的 序列 ， 一 个 数组 可 以 由 零 个 或 多 个 元 素 组 成 。 
因为 数组 的 长 度 是 固定 的 ， 因 此 在 Go 语言 中 很 少 直接 使 用 数组 。 和 数组 对 应 的 类 型 是 

Slice (WH) ， 它 是 可 以 增长 和 收缩 动态 序列 ，slice 功 能 也 更 灵活 ， 但 是 要 理解 slice 工 作 原 
理 的 话 需要 先 理解 数组 。 


数组 的 每 个 元 素 可 以 通过 索引 下 标 来 访问 ， 索 引 下 标的 范围 是 从 0 开始 到 数组 长 度 减 1 的 位 
置 。 内 置 的 len 函 数 将 返回 数组 中 元 素 的 个 数 。 


var a [3]int // array of 3 integers 
fmt.Println(a[0]) // print the fiyst element 
fmt.Printlin(a[len(a)-1]) // print the last element, a[2] 


// Print the indices and elements. 

for i, v := range a { 
fmt.Printf("%d %d\n", i, v) 

} 


// Print the elements only. 

for _, v := range a { 
fmt.Printf("%d\n", v) 

} 


默认 情况 下 ， 数 组 的 每 个 元 素 都 被 初始 化 为 元 素 类 型 对 应 的 零 值 ， 对 于 数字 类 型 来 说 就 是 0。 
我 们 也 可 以 使 用 数组 字面 值 语 法 用 一 组 值 来 初始 化 数组 : 


var q [3]int = [3]int{i, 2, 3} 
var r [3]int = [3]int{1, 2} 
fmt.Printin(r[2]) // "o" 


在 数组 字面 值 中 ， 如 果 在 数组 的 长 度 位 置 出 现 的 是 “...” 省 略 号 ， 则 表示 数组 的 长 度 是 根据 初始 
化 值 的 个 数 来 计算 。 因 此 ， 上 面 q 数 组 的 定义 可 以 简化 为 


dec | et es Ay 3 
fmt.Printf("%T\n", q) // "[3]int" 


数组 的 长 度 是 数组 类 型 的 一 个 组 成 部 分 ， 因 此 [3]int 和 [4]int 是 两 种 不 同 的 数组 类 型 。 数 组 的 长 
度 必须 是 常量 表达 式 ， 因 为 数组 的 长 度 需要 在 编译 阶段 确定 。 


O S Sian { 275 oi 
q = [4]int{1, 2, 3, 4} // compile error: cannot assign [4]int to [3]int 


我 们 将 会 发 现 ， 数 组 、slice、map 和 结构 体 字 面值 的 写法 都 很 相似 。 上 面 的 形式 是 直接 提供 
顺序 初始 化 值 序列 ， 但 是 也 可 以 指定 一 个 索引 和 对 应 值 列 表 的 方式 初始 化 ， 就 像 下 面 这 样 : 


type Currency int 


const ( 
USD Currency = iota // 美元 


EUR // 欧元 
GBP // ZÈ 
RMB // 人 民 币 


) 
Symbol := [...]string{USD: "$", EUR: "€", GBP: "£", RMB: "¥"} 


fmt .Println(RMB, symbol[RMB]) // "3 ¥" 


在 这 种 形式 的 数组 字面 值 形式 中 ， 初 始 化 索引 的 顺序 是 无 关 紧 要 的 ， 而 且 没 用 到 的 索引 可 以 
省 略 ， 和 前 面 提 到 的 规则 一 样 ， 未 指定 初始 值 的 元 素 将 用 零 值 初 始 化 。 例 如 ， 


r := [...]Jint{99: -1} 


定义 了 一 个 含有 100 个 元 素 的 数组 r， 最 后 一 个 元 素 被 初始 化 为 -1， 其 它 元 素 都 是 用 0 初始 化 。 


如 果 一 个 数组 的 元 素 类 型 是 可 以 相互 比较 的 ， 那 么 数组 类 型 也 是 可 以 相互 比较 的 ， 这 时 候 我 
们 可 以 直接 通过 == 上 比较 运算 符 来 比较 两 个 数组 ， 只 有 当 两 个 数组 的 所 有 元 素 都 是 相等 的 时 候 
数组 才 是 相等 的 。 不 相等 比较 运算 符 != 遵 循 同样 的 规则 。 


a := [2]int{i, 2} 
b := [...]int{1, 2} 
c := [2]int{1, 3} 


fmt.Println(a == b, a == c, b == c) // "true false false" 
d := [3]int{i, 2} 
fmt.Printlin(a == d) // compile error: cannot compare [2]int == [3]int 


HEA — ik & 04945] F > crypto/sha256 & 4) Sum256 $ Hk xt — MES F F slice KH ig SHEE 
成 一 个 对 应 的 消息 摘要 。 消 息 摘 要 有 256bit 大 小 ， 因 此 对 应 [32]byte 数 组 类 型 。 如 果 两 个 消息 
摘要 是 相同 的 ， 那 么 可 以 认为 两 个 消息 本 身 也 是 相同 (译注 : 理论 上 有 HASH 码 碰撞 的 情况 ， 
但 是 实际 应 用 可 以 基本 忽略 ) ; 如 果 消 息 摘要 不 同 ， 那 么 消息 本 身 必然 也 是 不 同 的 。 下 面 的 
例子 用 SHA256 算 法 分 别 生 成 x" 和“X” 两 个 信息 的 摘要 : 


gopl.io/ch4/sha256 


import "crypto/sha256" 


func main() { 
c1 := sha256.Sum256([]byte("x")) 
c2 := sha256.Sum256([]byte("X")) 
fmt .Printf("%x\n%x\n%t\n%T\n", c1, c2, c1 == c2, c1) 
// Output: 
// 2d711642b726b04401627ca9fbac32f5c8530fb1903cc4db02258717921a4881 
// 4b68ab3847feda7d6c62c1fbcbeebfa35eab7351ed5e78f4ddadea5df64b8015 
// false 
// [32]uint8 


上 面 例子 中 ， 两 个 消息 虽然 只 有 一 个 字符 的 差异 ， 但 是 生成 的 消息 摘要 则 几乎 有 一 半 的 bit 位 
是 不 相同 的 。 需 要 注意 Printf 函 数 的 %x 副 词 参数 ， 它 用 于 指定 以 十 六 进 制 的 格式 打印 数组 或 
slice 全 部 的 元 素 ，%t 副 词 参 数 是 用 于 打印 布尔 型 数据 ，%T 副 词 参数 是 用 于 显示 一 个 值 对 应 的 
数据 类 型 。 


当 调 用 一 个 函数 的 时 候 ， 函 数 的 每 个 调用 参数 将 会 被 赋值 给 函数 内 部 的 参数 变量 ， 所 以 函数 
参数 变量 接收 的 是 一 个 复制 的 副本 ， 并 不 是 原始 调用 的 变量 。 因 为 函数 参数 传递 的 机 制导 致 
传递 大 的 数组 类 型 将 是 低 效 的 ， 并 且 对 数组 参数 的 任何 的 修改 都 是 发 生 在 复制 的 数组 上 ， 并 
不 能 直接 修改 调用 时 原始 的 数组 变量 。 在 这 个 方面 ，Go 语 言 对 待 数 组 的 方式 和 其 它 很 多 编程 
语言 不 同 ， 其 它 编程 语言 可 能 会 隐 式 地 将 数组 作为 引用 或 指针 对 象 传 入 被 调用 的 函数 。 


当然 ， 我 们 可 以 显 式 地 传 入 一 个 数组 指针 ， 那 样 的 话 函 数 通 过 指针 对 数组 的 任何 修改 都 可 以 
直接 反馈 到 调用 者 。 下 面 的 函数 用 于 给 [32]byte 类 型 的 数组 清 零 : 


func zero(ptr *[32]byte) { 
for i := range ptr { 
ptr[i] = 0 
} 


其 实数 组 字面 值 [32]byte{f} 就 可 以 生成 一 个 32 字 节 的 数组 。 而 且 每 个 数组 的 元 素 都 是 零 值 初始 
化 ， 也 就 是 0。 因 此 ， 我 们 可 以 将 上 面 的 zero 元 数 写 的 更 简洁 一 点 : 


func zero(ptr *[32]byte) { 
*ptr = [32]byte{} 
} 


虽然 通过 指针 来 传递 数组 参数 是 高 效 的 ， 而 且 也 允许 在 函数 内 部 修改 数组 的 值 ， 但 是 数组 依 
然 是 僵化 的 类 型 ， 因 为 数组 的 类 型 包含 了 僵化 的 长 度 信息 。 上 面 的 zero 函 数 并 不 能 接收 指向 
[16]byte 类 型 数组 的 指针 ， 而 且 也 没有 任何 添加 或 删除 数组 元 素 的 方法 。 由 于 这 些 原因 ， 除 了 


像 SHA256 这 类 需要 处 理 特定 大 小 数组 的 特例 外 ， 数 组 依然 很 少 用 作 函 数 参 数 ; 相反 ， 我 们 一 
般 使 用 slice 来 替代 数组 。 


练习 4.1: 编写 一 个 元 数 ， 计 算 两 个 SHA256 哈 希 码 中 不 同 bit 的 数目 。 (参考 2.6.2 节 的 
PopCount hä ° ) 


小 


练习 4.2 : 编写 一 个 程序 ， 上 默认 打印 标准 输入 的 以 SHA256 哈 希 码 ， 也 可 以 通过 命令 行 标准 参 
数 选择 SHA384 或 SHA512 哈 希 算法 。 


4.2. Slice 


Slice (WH) 代表 变 长 的 序列 ， 序 列 中 每 个 元 素 都 有 相同 的 类 型 。 一 个 slice 类 型 一 般 写 作 
[IT， 其 中 T 代 表 slice 中 元 素 的 类 型 ; slice 的 语法 和 数组 很 像 ， 只 是 没有 固定 长 度 而 已 。 


数组 和 slice 之 间 有 着 紧密 的 联系 。 一 个 slice 是 一 个 轻 量 级 的 数据 结构 ， 提 供 了 访问 数组 子 序 
列 (或 者 全 部 ) 元 素 的 功能 ， 而 且 gslice 的 底层 确实 引用 一 个 数组 对 象 。 一 个 slice 由 三 个 部 分 
构成 : 指针 、 长 度 和 容量 。 指 针 指 向 第 一 个 slice 元 素 对 应 的 底层 数组 元 素 的 地 址 ， 要 注意 的 
是 slice 的 第 一 个 元 素 并 不 一 定 就 是 数组 的 第 一 个 元 素 。 长 度 对 应 slice 中 元 素 的 数目 ; 长 度 不 
能 超过 容量 ， 容 量 一 般 是 从 slice 的 开始 位 置 到 底层 数据 的 结尾 位 置 。 内 置 的 len 和 cap 函 数 分 
别 返回 slice 的 长 度 和 容量 。 


多 个 slice 之 间 可 以 共享 底层 的 数据 ， 并 且 引 用 的 数组 部 分 区 间 可 能 重 登 。 图 4.1 显 示 了 表示 一 
年 中 每 个 月 份 名 字 的 字符 串 数 组 ， 还 有 重合 引用 了 该 数组 的 两 个 slice。 数 组 这 样 定义 


months := [...]string{1: "January", /* ... */, 12: "December"} 


因此 一 月 份 是 months[1]， 十 三 月 份 是 months[12]。 通 常 ， 数 组 的 第 一 个 元 素 从 索引 0 开始 ， 但 
是 月 份 一 般 是 从 1 开始 的 ， 因 此 我 们 声明 数组 时 直接 跳 过 第 0 个 元 素 ， 第 0 个 元 素 会 被 自动 初始 
化 为 空 字符 串 。 


slice 的 切片 操作 s[ij]， 其 中 0 sis js cap(sS)， 用 于 创建 一 个 新 的 slice， 引 用 S 的 从 第 i 个 元 素 开 
始 到 第 j-1 个 元 素 的 子 序列 。 新 的 slice 将 只 有 j-i 个 元 素 。 如 果 i 位 置 的 索引 被 省 略 的话 将 使 用 0 代 
替 ， 如 果 j 位 置 的 索引 被 省 略 的 话 将 使 用 len(s) 代 替 。 因 此 ，months[1:13] 切 片 操作 将 引用 全 部 
有 效 的 月 份 ， 和 months[1:] 操 作 等 价 ; months[:] 切 片 操 作 则 是 引用 整个 数组 。 让 我 们 分 别 定义 
表示 第 二 季度 和 北方 夏天 月 份 的 slice， 它 们 有 重生 部 分 : 


months 






Q2 = months[4:7] g months[6:9] 


“March” 


Ar 


We 


Figure 4.1. Two overlapping slices of an array of months. 


Q2 := months[4:7] 

summer := months[6:9] 

fmt .Print1n(Q2) // ["April" "May" "June"] 
fmt.Printin(summer) // ["June" "July" "August"] 


两 个 slice 都 包含 了 六 月 份 ， 下 面 的 代码 是 一 个 包含 相同 月 份 的 测试 (性 能 较 低 ) 


for _, Ss := range summer { 
for _, q := range Q2 { 
if s==q{ 


fmt.Printf("%s appears in both\n", s) 


如 果 切 片 操作 超出 cap(s) 的 上 限 将 导致 一 个 panic 异 常 ， 但 是 超出 len(s) 则 是 意味 着 扩展 了 
slice， 因 为 新 slice 的 长 度 会 变 大 : 


Slice 125 


fmt.Println(summer[:20]) // panic: out of range 


endlessSummer := summer[:5] // extend a slice (within capacity) 
fmt.Println(endlessSummer) // "[June July August September October]" 


另外 ， 字 符 串 的 切片 操作 和 []byte 字 节 类 型 切片 的 切片 操作 是 类 似 的 。 它 们 都 写作 x[m:n]， 并 
且 都 是 返回 一 个 原始 字 节 系列 的 子 序 列 ， 底 层 都 是 共享 之 前 的 底层 数组 ， 因 此 切片 操作 对 应 
常量 时 间 复 杂 度 。x[m:n] 切 片 操作 对 于 字符 串 则 生成 一 个 新 字符 串 ， 如 果 x 是 []byte 的 话 则 生成 
一 个 新 的 [lbyte。 


因为 slice 值 包含 指向 第 一 个 slice 元 素 的 指针 ， 因 此 向 函数 传递 slice 将 允许 在 函数 内 部 修改 底 
层 数组 的 元 素 。 换 多 话说 ， 复 制 一 个 slice 只 是 对 底层 的 数组 创建 了 一 个 新 的 slice 别 名 

(§2.3.2) 。 下 面 的 reverse 函 数 在 原 内 存 空 间 将 [jint 类 型 的 slice 反 转 ， 而 且 它 可 以 用 于 任意 长 
度 的 slice。 


gopl.io/ch4/rev 


// reverse reverses a slice of ints in place. 
func reverse(s []Jint) { 
mole ah, 9) B=), kens) ab << a/R aly E ainsi, ajeal 4 
s[i], s[j] = s[j], s[i] 
} 


这 里 我 们 反 转 数组 的 应 用 : 


a = anto aly 2 3, 4 5} 
reverse(a[:]) 
fmt.Printin(a) // "[5 43 21 0]" 


一 种 将 slice 元 素 循 环 向 左旋 转 n 个 元 素 的 方法 是 三 次 调用 reverse 反 转 函 数 ， 第 一 次 是 反 转 开头 
的 n 个 元 素 ， 然 后 是 反 转 剩 下 的 元 素 ， 最 后 是 反 转 整个 slice 的 元 素 。 (如 果 是 向 右 循环 旋转 ， 
则 将 第 三 个 函数 调用 移 到 第 一 个 调用 位 置 就 可 以 了 。) 


s := []int{0, 1, 2, 3, 4, 5} 

// Rotate s left by two positions. 
reverse(s[:2]) 

reverse(s[2:]) 

reverse(s) 

fmt.Printin(s) // "(23450 1]" 


要 注意 的 是 slice 类 型 的 变量 s 和 数组 类 型 的 变量 a 的 初始 化 语法 的 差异 。slice 和 数组 的 字面 值 
语法 很 类 似 ， 它 们 都 是 用 花 括 弧 和 包含 一 系列 的 初始 化 元 素 ， 但 是 对 于 slice 并 没有 指明 序列 的 
长 度 。 这 会 隐 式 地 创建 一 个 合适 大 小 的 数组 ， 然 后 slice 的 指针 指向 底层 的 数组 。 就 像 数 组 字 


面值 一 样 ，slice 的 字面 值 也 可 以 按 顺序 指定 初始 化 值 序列 ， 或 者 是 通过 索引 和 元 素 值 指定 ， 
或 者 的 两 种 风格 的 混合 语法 初始 化 。 


和 数组 不 同 的 是 ，slice 之 间 不 能 比较 ， 因 此 我 们 不 能 使 用 == 操 作 符 来 判断 两 个 slice 是 否 含有 
全 部 相等 元 素 。 不 过 标准 库 提 供 了 高 度 优 化 的 bytes.Equal 函 数 来 判断 两 个 字 节 型 slice 是 否 相 
等 〈[lbyte) ， 但 是 对 于 其 他 类 型 的 slice， 我 们 必须 自己 展开 每 个 元 素 进行 比较 : 


func equal(x, y []string) bool { 
if len(x) != len(y) { 
return false 


} 
for i := range x { 
if x[i] != y[i] { 
return alse 
} 
} 


return true 


上 面 关 于 两 个 slice 的 深度 相等 测试 ， 运 行 的 时 间 并 不 比 支持 == 操 作 的 数组 或 字符 串 更 多 ， 但 
是 为 何 slice 不 直接 支持 比较 运算 符 呢 ?这 方面 有 两 个 原因 。 第 一 个 原因 ， 一 个 slice 的 元 素 是 
间接 引用 的 ， 一 个 slice 其 至 可 以 包含 自身 。 虽 然 有 很 多 办 法 处 理 这 种 情形 ， 但 是 没有 一 个 是 
简单 有 效 的 。 


第 二 个 原因 ， 因 为 slice 的 元 素 是 间接 引用 的 ， 一 个 国定 值 的 slice 在 不 同 的 时 间 可 能 包含 不 同 
的 元 素 ， 因 为 底层 数组 的 元 素 可 能 会 被 修改 。 并 且 Go 语 言 中 map 等 哈 希 表 之 类 的 数据 结构 的 
key 只 做 简单 的 浅 找 贝 ， 它 要 求 在 整个 声明 周期 中 相等 的 key 必 须 对 相同 的 元 素 。 对 于 像 指针 
或 chan 之 类 的 引用 类 型 ，== 相 等 测试 可 以 判断 两 个 是 否 是 引用 相同 的 对 象 。 一 个 针对 slice 的 
浅 相等 测试 的 == 操 作 符 可 能 是 有 一 定 用 处 的 ， 也 能 临时 解决 map 类 型 的 key 问 题 ， 但 是 slice 和 
数组 不 同 的 相等 测试 行为 会 让 人 困惑 。 因 此 ， 安 全 的 做 法 是 直接 禁止 slice 之 间 的 比较 操作 。 


slice 唯 一 合法 的 比较 操作 是 和 nil 比 较 ， 例 如 : 


if summer == nil { /* ... */ } 


一 个 零 值 的 slice 等 于 nil。 一 个 nil 值 的 slice 并 没有 底层 数组 。 一 个 nil 值 的 slice 的 长 度 和 容量 都 
是 0， 但 是 也 有 非 nil 值 的 slice 的 长 度 和 容量 也 是 0 的 ， 例 如 [jintf} 或 make([lint, 3)[3:] 。 与 任意 类 
型 的 nil 值 一 样 ， 我 们 可 以 用 [Jint(nil) 类 型 转换 表达 式 来 生成 一 个 对 应 类 型 slice 的 nil 值 。 


var s []int // len(s) == 0, s == nil 
s = nil // len(s) == 0, s == nil 
s = []Jint(nil) // len(s) == 0, s == nil 
s = []int{} // len(s) == 0, s != nil 


如 果 你 需要 测试 一 个 slice 是 否 是 空 的 ， 使 用 len(s) == 0 来 判断 ， 而 不 应 该 用 s == nil 来 判断 。 
除了 和 nil 相 等 比较 外 ， 一 个 nil 值 的 slice 的 行为 和 其 它 任 意 0 长 度 的 slice 一 样 ; 例如 reverse(nil) 
也 是 安全 的 。 除 了 文档 已 经 明确 说 明 的 地 方 ， 所 有 的 Go 语言 函数 应 该 以 相同 的 方式 对 待 nil 值 
的 slice 和 0 长 度 的 slice。 


内 置 的 make 函 数 创建 一 个 指定 元 素 类 型 、 长 度 和 容量 的 slice。 容 量 部 分 可 以 省 略 ， 在 这 种 情 
况 下 ， 容 量 将 等 于 长 度 。 
make([]T, len) 


make([]T, len, cap) // same as make([]T, cap)[:len] 


在 底层 ，make 创 建 了 一 个 匿名 的 数组 变量 ， 然 后 返回 一 个 slice ; 只 有 通过 返回 的 slice 才 能 引 
用 底层 匿名 的 数组 变量 。 在 第 一 种 语句 中 ，Sslice 是 整个 数组 的 view。 在 第 二 个 语句 中 ，Sslice 
只 引用 了 底层 数组 的 前 len 个 元 素 ， 但 是 容量 将 包含 整个 的 数组 。 额 外 的 元 素 是 留 给 未 来 的 增 
长 用 的 。 

4.2.1. append 4 2 

内 置 的 append 函 数 用 于 向 slice 追 加 元 素 : 


var runes []rune 
for _, r := range "Hello, ##" { 
runes = append(runes, r) 


Teme CoN. TMs) 47 MLTR Uae Ba Ma G a et eee 
E Wa P Ak Fl append && 444 E — A h ZU rune 44 44 AY Slice ， 当 然 对 应 这 个 特殊 的 问题 我 
们 可 以 通过 Go 语言 内 置 的 []rune("Hello, 世界 ") 转 换 操 作 完 成 。 


append 函 数 对 于 理解 slice 底 层 是 如 何 工作 的 非常 重要 ， 所 以 让 我 们 仔细 查看 究竟 是 发 生 了 什 
么 。 下 面 是 第 一 个 版 本 的 appendlnt 函 数 ， 专 门 用 于 处 理 []jint 类 型 的 slice : 


gopl.io/ch4/append 


func appendInt(x []int, y int) []Jint { 
var z []Jint 
zlen := len(x) + 1 
if zlen <= cap(x) { 
// There is room to grow. Extend the slice. 
z = x[:zlen] 
} else { 
// There is insufficient space. Allocate a new array. 
// Grow by doubling, for amortized linear complexity. 
zcap := zlen 
if zcap < 2*len(x) { 
zcap = 2 * len(x) 
} 
z = make([]int, zlen, zcap) 
copy(z, X) // a built-in function; see text 
} 
z[len(x)] = y 
return z 
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如 果 有 足够 空间 的 话 ， 直 接 扩展 slice (依然 在 原 有 的 底层 数组 之 上 ) ， 将 新 添加 的 y 元 素 复 制 
到 新 扩展 的 空间 ， 并 返回 slice。 因 此 ， 输 入 的 X 和 输出 的 z 共 享 相同 的 底层 数组 。 


如 果 没 有 足够 的 增长 空间 的 话 ，appendInt 亟 数 则 会 先 分 配 一 个 足够 大 的 slice 用 于 保存 新 的 结 
果 ， 先 将 输入 的 x 复制 到 新 的 空间 ， 然 后 添加 y 元 素 。 结 果 z 和 输入 的 x 引用 的 将 是 不 同 的 底层 
数组 。 


虽然 通过 循环 复制 元 素 更 直接 ， 不 过 内 置 的 copy 有 函数 可 以 方便 地 将 一 个 slice 复 制 另 一 个 相同 
类 型 的 slice。copy 函 数 的 第 一 个 参数 是 要 复制 的 目标 slice， 第 二 个 参数 是 源 slice， 目 标 和 源 
的 位 置 顺序 和 dst = src 赋值 语句 是 一 致 的 。 两 个 slice 可 以 共享 同一 个 底层 数组 ， 其 至 有 重 
党 也 没有 问题 。copy 函 数 将 返回 成 功 复 制 的 元 素 的 个 数 (我 们 这 里 没有 用 到 ) ， 等 于 两 个 
slice 中 较 小 的 长 度 ， 所 以 我 们 不 用 担心 覆盖 会 超出 目标 slice 的 范围 。 


为 了 提高 内 存 使 用 效率 ， 新 分 配 的 数组 一 般 略 大 于 保存 X 和 y 所 需要 的 最 低 大 小 。 通 过 在 每 次 
扩展 数组 时 直接 将 长 度 翻 倍 从 而 避免 了 多 次 内 存 分 配 ， 也 确保 了 添加 单个 元 素 操 的 平均 时 间 
是 一 个 常数 时 间 。 这 个 程序 演示 了 效果 : 


func main() { 
var x, y []Jint 
pog ak Be Op ak << sole alarar oi 
y = appendiInt(x, i) 
fmt.Printf("%d cap=%d\t%v\n", i, cap(y), y) 
Xy 


每 一 次 容量 的 变化 都 会 导致 重新 分 配 内 存 和 copy 操 作 : 


© cap=1 [0] 

1 cap=2 [0 1] 

2 cap=4 [0 1 2] 

3 Ccap=4 [9 1 2 3] 

4 cap=8 [0 1 2 3 4] 

5 cap=8 (01234 5] 

6 cap=8 [012345 6] 

7 cap=8 [01234567] 

8 cap=16 [01234567 8] 
9 cap=16 [012345678 9] 


让 我 们 仔细 查看 j=3 次 的 迭代。 当时 X 包 含 了 [0 1 2] 三 个 元 素 ， 但 是 容量 是 4， 因 此 可 以 简单 将 
新 的 元 素 添 加 到 末尾 ， 不 需要 新 的 内 存 分 配 。 然 后 新 的 y 的 长 度 和 容量 都 是 4， 并 且 和 X 引 用 着 
相同 的 底层 数组 ， 如 图 4.2 所 示 。 


“len=cap=4 ,….………..- ‘ y = appendInt(x, 3) 





Figure 4.2. Appending with room to grow. 


在 下 一 次 选 代 时 ji=4， 现 在 没有 新 的 空余 的 空间 了 ， 因 此 appendlnt 函 数 分 配 一 个 容量 为 8 的 底 
层 数 组 ， 将 x 的 4 个 元 素 [0 12 3] 复 制 到 新 空间 的 开头 ， 然 后 添加 新 的 元 素 j， 新 元 素 的 值 是 4。 
新 的 y 的 长 度 是 5， 容 量 是 8 ; 后 面 有 3 个 空闲 的 位 置 ， 三 次 迭代 都 不 需要 分 配 新 的 空间 。 当 前 
和 迭代 中 ，y 和 X 是 对 应 不 同 底 层 数组 的 view。 这 次 操作 如 图 4.3 所 示 。 





Figure 4.3. Appending without room to grow. 


内 置 的 append 函 数 可 能 使 用 比 appendlnt 更 复杂 的 内 存 扩 展 策 略 。 因 此 ， 通 常 我 们 并 不 知道 
append 调 用 是 否 导 致 了 内 存 的 重新 分 配 ， 因 此 我 们 也 不 能 确认 新 的 slice 和 原始 的 slice 是 否 引 
用 的 是 相同 数组 空间 。 同 样 ， 我 们 不 能 确认 在 原 CA 会 影响 到 新 的 
slice。 因 此 ， 是 将 append 返 回 的 结果 直接 赋值 给 输入 的 slice 变 


runes = append(runes, r) 


更 新 slice 变 量 不 仅 对 调用 append 函 数 是 必要 的 ， 实 际 上 对 应 任何 可 能 导致 长 度 、 PaA 
数组 变化 的 操作 都 是 必要 的 。 要 正确 地 使 用 slice ， a 接 访问 


的 ， 但 是 slice 对 应 结构 体 本 身 的 指针 、 长 度 和 容量 部 分 是 直接 访问 的 。 要 更 新 这 些 信息 需要 
像 上 面 例子 那样 一 个 显 式 的 赋值 操作 。 从 这 个 角度 看 ，slice 并 不 是 一 个 纯粹 的 引用 类 型 ， 它 
实际 上 是 一 个 类 似 下 面 结构 体 的 聚合 类 型 : 


type IntSlice struct { 
ptr *int 
len, cap int 


我 们 的 appendlnt 函 数 每 次 只 能 向 slice 追 加 一 个 元 素 ， 但 是 内 置 的 append 函 数 则 可 以 追加 多 个 
元 素 ， 其 至 追加 一 个 slice。 


var x []int 

x = append(x, 1) 

X = append(x, 2, 3) 

x = append(x, 4, 5, 6) 

x = append(x, x...) // append the slice x 

fmt .Println(x) Hi “El 2 eA Ga Be 4a BP 


通过 下 面 的 小 修改 ， 我 们 可 以 可 以 达到 append 函 数 类 似 的 功能 。 其 中 在 appendlnt 函 数 参数 中 
的 最 后 的 “..." 省 略 号 表示 接收 变 长 的 参数 为 slice。 我 们 将 在 5.7 节 详细 解释 这 个 特性 。 


func appendInt(x []int, y ...int) [lint { 
var z []Jint 
zlen := len(x) + len(y) 


// ...expand z to at least zlen... 
copy(z[len(x):], y) 
eeu M EZ, 


为 了 避免 重复 ， 和 前 面相 同 的 代码 并 没有 显示 。 


4.2.2. Slice 内 存 技巧 


让 我 们 看 看 更 多 的 例子 ， 比 如 旋转 slice、 反 转 slice 或 在 slice 原 有 内 存 空间 修改 元 素 。 给 定 一 
个 字符 囊 列表 ， 下 面 的 nonempty 骂 数 将 在 原 有 slice 内 存 空 间 之 上 返回 不 包含 空 字符 串 的 列 
表 : 


gopl.io/ch4/nonempty 


// Nonempty is an example of an in-place slice algorithm. 
package main 


import "fmt" 
// nonempty returns a slice holding only the non-empty strings. 


// The underlying array is modified during the call. 
func nonempty(strings []string) []string { 


i := 0 
for _, s := range strings { 
ifs!="" { 
strings[i] = s 
i++ 
} 
} 


return strings[:i] 


比较 微妙 的 地 方 是 ， 输 入 的 slice 和 输出 的 slice 共 享 一 个 底层 数组 。 这 可 以 避免 分 配 另 一 个 数 
组 ， 不 过 原来 的 数据 将 可 能 会 被 乾 盖 ， 正 如 下 面 两 个 打印 语句 看 到 的 那样 : 


data := []string{"one", "", "three"} 
fmt.Printf("%q\n", nonempty(data)) // ~["one" "three"]. 
fmt .Printf("%q\n", data) // {*one’ “three™ “three ||: 


因此 我 们 通常 会 这 样 使 用 nonempty 函 数 : data = nonempty(data) ° 


nonempty $% 4&4 T V$ A) append H žr FHL : 


func nonempty2(strings []string) []string { 


out := strings[:0] // zero-length slice of original 
for _, s := range strings { 
aay o eS u i 


out = append(out, s) 
} 
} 


return out 


无 论 如 何 实 现 ， 以 这 种 方式 重用 一 个 slice 一 般 都 要 求 最 多 为 每 个 输入 值 产生 一 个 输出 值 ， 事 
实 上 很 多 这 类 算法 都 是 用 来 过 滤 或 合并 序列 中 相 邻 的 元 素 。 这 种 slice 用 法 是 比较 复杂 的 技 
巧 ， 虽然 使 用 到 了 slice 的 一 些 技巧 ， 但 是 对 于 某 些 场 合 是 比较 清晰 和 有 效 的 。 


一 个 slice 可 以 用 来 模拟 一 个 stack。 最 初 给 定 的 空 slice 对 应 一 个 空 的 stack， 然 后 可 以 使 用 
append 函 数 将 新 的 值 压 入 stack : 


stack = append(stack, v) // push v 


stack 的 顶部 位 置 对 应 slice 的 最 后 一 个 元 素 : 


top := stack[len(stack)-1] // top of stack 


通过 收缩 stack 可 以 弹出 栈 顶 的 元 素 


stack = stack[:len(stack)-1] // pop 


要 删除 slice 中 间 的 某 个 元 素 并 保存 原 有 的 元 素 顺 序 ， 可 以 通过 内 置 的 copy 函 数 将 后 面 的 子 
slice 向 前 依次 移动 一 位 完成 : 


func remove(slice []Jint, i int) []int { 
copy(slice[i:], slice[it+1:]) 
return slice[:len(slice)-1] 


} 


func main() { 
= []int{5, 6, 7, 8, 9} 
fmt.Println(remove(s, 2)) // "[5 6 8 9]" 


如 果 删 除 元 素 后 不 用 保持 原来 顺序 的 话 ， 我 们 可 以 简单 的 用 最 后 一 个 元 素 履 盖 被 删除 的 元 
Žž: 


func remove(slice []Jint, i int) []Jint { 
slice[i] = slice[len(slice) -1] 
return slice[:len(slice)-1] 


} 
func main() { 


s := []Jint{5, 6, 7, 8, 9} 
fmt.Println(remove(s, 2)) // "[5 6 9 8] 


练习 4.3: © Sreverse HA > 1% M žr 4048 4 Kh ž slice ° 
练习 4.4 : 编写 一 个 rotate 有 函数 ， 通 过 一 次 循环 完成 旋转 。 
练习 4.5 : 写 一 个 函数 在 原 地 完成 消除 [jstring 中 相 邻 重复 的 字符 串 的 操作 。 


练习 4.6 : 编写 一 个 函数 ， 原 地 将 一 个 UTF-8 编 码 的 [jbyte 类 型 的 slice 中 相 邻 的 空格 (参考 
unicode.IsSpace) 替换 成 一 个 空格 返回 


练习 4.7 : 修改 reverse 函 数 用 于 原 地 反 转 UTF-8 编 码 的 []jbyte。 是 否 可 以 不 用 分 配额 外 的 内 
存 ? 


4.3. Map 
哈 希 表 是 一 种 巧妙 并 且 实用 的 数据 结构 。 它 是 一 个 无 序 的 key/value 对 的 集合 ， 其 中 所 有 的 key 
都 是 不 同 的 ， 然 后 通过 给 定 的 key 可 以 在 常数 时 间 复 杂 度 内 检索 、 更 新 或 删除 对 应 的 value。 


在 Go 语言 中 ， 一 个 map 就 是 一 个 哈 希 表 的 引用 ，map 类 型 可 以 写 为 map[K]V， 其 中 K 和 V 分 别 
对 应 key 和 value。map 中 所 有 的 key 都 有 相同 的 类 型 ， 所 有 的 value 也 有 着 相同 的 类 型 ， 但 是 
key 和 value 之 间 可 以 是 不 同 的 数据 类 型 。 其 中 K 对 应 的 key 必 须 是 支持 == 比 较 运 算 符 的 数据 类 
型 ， 所 以 map 可 以 通过 测试 key 是 否 相 等 来 判断 是 否 已 经 存在 。 虽 然 浮 点 数 类 型 也 是 支持 相等 
运算 符 比 较 的 ， 但 是 将 浮 点 数 用 做 key 类 型 则 是 一 个 坏 的 想法 ， 正 如 第 三 章 提 到 的 ， 最 坏 的 情 
况 是 可 能 出 现 的 NaN 和 任何 浮 点 数 都 不 相等 。 对 于 V 对 应 的 value 数 据 类 型 则 没有 任何 的 限 

制 。 


内 置 的 make 函 数 可 以 创建 一 个 map : 


ages := make(map[String]int) // mapping from strings to ints 


我 们 也 可 以 用 map 字 面值 的 语法 创建 nap， 同 时 还 可 以 指定 一 些 最 初 的 key/value : 


ages := map[string]lintf{ 
valicen: 31, 
“charlie: 34, 


这 相当 于 


ages := make(map[string]int) 
ages["alice"] = 31 
ages["charlie"] = 34 


Aik > 4—FP Ol 2 = maps KA AX map[string]int{} ° 


Map 中 的 元 素 通 过 key 对 应 的 下 标语 法 访问 : 


ages["alice"] = 32 
fmt.Println(ages["alice"]) // "32" 


i$ A A E delete hA T MAMIE ATE : 


delete(ages, "alice") // remove element ages["alice"] 


所 有 这 些 操作 是 安全 的 ， 即 使 这 些 元 素 不 在 map 中 也 没有 关系 ; 如 果 一 个 查找 失败 将 返回 
Value 类 型 对 应 的 零 值 ， 例 如 ， 即 使 map 中 不 存在 “bob” 下 面 的 代码 也 可 以 正常 工作 ， 因 为 
ages["bob"] 失 败 时 将 返回 0 。 


ages["bob"] = ages["bob"] + 1 // happy birthday! 


而 且 x += y 和 xe 等 简短 赋值 语法 也 可 以 用 在 map 上 ， 所 以 上 面 的 代码 可 以 改写 成 


ages["bob"] += 1 


更 简单 的 写法 


ages["bob"]++ 


但 是 map 中 的 元 素 并 不 是 一 个 变量 ， 因 此 我 们 不 能 对 map 的 元 素 进行 取 址 操作 : 


_ = &ages["bob"] // compile error: cannot take address of map element 


禁止 对 map 元 素 取 址 的 原因 是 map 可 能 随 着 元 素数 量 的 增长 而 重新 分 配 更 大 的 内 存 空间 ， 从 而 
可 能 导致 之 前 的 地 址 无 效 。 


要 想 遍 历 map 中 全 部 的 key/value 对 的 话 ， 可 以 使 用 range 风 格 的 for 循 环 实现 ， 和 之 前 的 slice 遍 
历 语法 类 似 。 下 面 的 迭代 语句 将 在 每 次 先 代 时 设置 name 和 age 变量 ， 它 们 对 应 下 一 个 键 / 值 
xt: 


for name, age := range ages { 
fmt.Printf("%s\t%d\n", name, age) 


Map 的 迭代 顺序 是 不 确定 的 ， 并 且 不 同 的 哈 希 函数 实现 可 能 导致 不 同 的 遍历 顺序 。 在 实践 

中 ， 遍 历 的 顺序 是 随机 的 ， 每 一 次 遍历 的 顺序 都 不 相同 。 这 是 故意 的 ， 每 次 都 使 用 随机 的 遍 
历 顺 序 可 以 强制 要 求 程序 不 会 依赖 具体 的 哈 希 函数 实现 。 如 果 要 按 顺序 遍历 key/value 对 ， 我 
们 必须 显 式 地 对 key 进 行 排 序 ， 可 以 使 用 Sort 包 的 Strings 函 数 对 字符 串 slice 进 行 排序 。 下 面 是 
常见 的 处 理 方 式 : 


import "sort" 


var names []string 
for name := range ages { 
names = append(names, name) 


} 

sort.Strings(names) 

for _, name := range names { 
fmt.Printf("%s\t%d\n", name, ages[name] ) 


因为 我 们 一 开始 就 知道 names 的 最 终 大 小 ， 因 此 给 slice 分 配 一 个 合适 的 大 小 将 会 更 有 效 。 下 
面 的 代码 创建 了 一 个 空 的 slice， 但 是 slice 的 容量 刚好 可 以 放下 map 中 全 部 的 key : 


names := make([]string, ©, len(ages)) 


在 上 面 的 第 一 个 range 循 环 中 ， 我 们 只 关心 map 中 的 key， 所 以 我 们 忽略 了 第 二 个 循环 变量 。 
在 第 二 个 循环 中 ， 我 们 只 关心 names 中 的 名 字 ， 所 以 我 们 使 用 "空白 标识 符 来 忽略 第 一 个 循 
环 变 量 ， 也 就 是 迭代 slice 时 的 索引 。 


map 类 型 的 零 值 是 nil， 也 就 是 没有 引用 任何 哈 希 表 。 
var ages map[string]int 


fmt.Println(ages == nil) Li enue. 
fmt.Println(len(ages) == 0) // "true" 


map 上 的 大 部 分 操作 ， 和 包括 查找 、 删 除 、len 和 [range 循 环 都 可 以 安全 工作 在 nil 值 的 map 上 ， 它 
们 的 行为 和 一 个 空 的 map 类 似 。 但 是 向 一 个 nil 值 的 map 存 入 元 素 将 导致 一 个 panic 蜡 常 : 


ages["carol"] = 21 // panic: assignment to entry in nil map 


在 向 map 存 数据 前 必须 先 创 建 map。 


通过 key 作 为 索引 下 标 来 访问 map 将 产生 一 个 value。 如 果 key 在 map 中 是 存在 的 ， 那 么 将 得 到 
与 key 对 应 的 value ; 如 果 key 不 存在 ， 那 么 将 得 到 value 对 应 类 型 的 零 值 ,正如 我 们 前 面 看 到 的 
ages["bob"] 那 样 。 这 个 规则 很 实用 ， 但 是 有 时 候 可 能 需要 知道 对 应 的 元 素 是 否 真 的 是 在 map 
之 中 。 例 如 ， 如 果 元 素 类 型 是 一 个 数字 ， 你 可 以 需要 区 分 一 个 已 经 存在 的 0， 和 不 存在 而 返回 
零 值 的 0， 可 以 像 下 面 这 样 测试 : 


age, ok := ages["bob"] 
if lok { /* "bob" is not a key in this map; age == 0. */ } 


你 会 经 常 看 到 将 这 两 个 结合 起 来 使 用 ， 像 这 样 : 


if age, ok := ages["bob"]; !ok { /* ... */ } 


在 这 种 场景 下 ，map 的 下 标语 法 将 产生 两 个 值 ; BAP E—DH RA? ATRELADA 
的 存在 。 布 尔 变 量 一 般 命 名 为 ok， 特 别 适合 马上 用 于 if 条 件 判 断 部 分 。 


和 slice 一 样 ，map 之 间 也 不 能 进行 相等 比较 ; 唯一 的 例外 是 和 nil 进 行 比 较 。 要 判断 两 个 nap 是 
否 包含 相同 的 key 和 value， 我 们 必须 通过 一 个 循环 实现 : 


func equal(x, y map[string]int) bool { 
if len(x) != len(y) { 
return false 


} 
for k, xv := range x { 
if yv, ok := y[k]; !ok || yv != xv { 
return false 
} 
} 


return true 


要 注意 我 们 是 如 何 用 lok 来 区 分 元 素 缺 失 和 元 素 不 同 的 。 我 们 不 能 简单 地 用 xv I= y[k] FI] BT > AB 
样 会 导致 在 判断 下 面 两 个 map 时 产生 错误 的 结果 : 


// True if equal is written incorrectly. 
equal(map[string]int{"A": 0}, map[string]int{"B": 42}) 


Go 语言 中 并 没有 提供 一 个 set 类 型 ， 但 是 map 中 的 key 也 是 不 相同 的 ， 可 以 用 map 实 现 类 似 set 
的 功能 。 为 了 说 明 这 一 点 ， 下 面 的 dedup 程 序 读 取 多 行 输入 ， 但 是 只 打印 第 一 次 出 现 的 行 。 

( 它 是 1.3 节 中 出 现 的 dup 程 序 的 变 体 。) dedup 程 序 通过 map 来 表示 所 有 的 输入 行 所 对 应 的 
Set 集合， 以 确保 已 经 在 集合 存在 的 行 不 会 被 重复 打印 。 


gopl.io/ch4/dedup 


func main() { 
seen := make(map[sString]bool) // a set of strings 
input := bufio.NewScanner(os.Stdin) 
for input.Scan() { 
line := input.Text() 
if !seen[line] { 
seen[line] = true 
fmt .Println(line) 


} 

if err := input.Err(); err != nil { 
fmt.Fprintf(os.Stderr, "dedup: %v\n", err) 
os.Exit(1) 

} 


Go 程序 员 将 这 种 忽略 value 的 map 当 作 一 个 字符 串 集 合 ， 并 非 所 有 map[string]bool 类 型 value 
都 是 无 关 紧 要 的 ; 有 一 些 则 可 能 会 同时 包含 true 和 false 的 值 。 


有 时 候 我 们 需要 一 个 map 或 set 的 key 是 slice 类 型 ， 但 是 map 的 key 必 须 是 可 比较 的 类 型 ， 但 是 
slice 并 不 满足 这 个 条 件 。 不 过 ， 我 们 可 以 通过 两 个 步骤 绕 过 这 个 限制 。 第 一 步 ， 定义 一 个 畏 
助 函 数 k， 将 slice 转 为 map 对 应 的 string 类 型 的 key， 确 保 只 有 Xx 和 y 相 等 时 k(x) == k(y) 才 成 立 。 
然后 创建 一 个 key 为 string 类 型 的 map， 在 每 次 对 map 操 作 时 先 用 k 辅 助 函 数 将 slice 转 化 为 string 


类 型 。 


下 面 的 例子 演示 了 如 何 使 用 map 来 记录 提交 相同 的 字符 串 列表 的 次 数 。 它 使 用 了 fmt.Sprintf 函 
数 将 字符 串 列表 转换 为 一 个 字符 串 以 用 于 map 的 key， 通 过 %q 参 数 忠 实地 记录 每 个 字符 串 元 
素 的 信息 : 


var m = make(map[string]int) 
func k(list []string) string { return fmt.Sprintf("%q", list) } 
func Add(list []string) { m[k(list)]++ } 


func Count(list []string) int { return m[k(list)] } 


使 用 同样 的 技术 可 以 处 理 任何 不 可 比较 的 key 类 型， 而 不 仅仅 是 slice 类 型 。 这 种 技术 对 于 想 使 
用 自 定 义 key 比 较 函 数 的 时 候 也 很 有 用 ， 例 如 在 比较 字符 串 的 时 候 忽略 大 小 写 。 同时 ， 辅 助 函 
数 K(X) 也 不 一 定 是 字符 串 类 型 ， 它 可 以 返回 任何 可 比较 的 类 型 ， 例 如 整数 、 数 组 或 结构 体 等 。 


这 是 map 的 另 一 个 例子 ， 下 面 的 程序 用 于 统计 输入 中 每 个 Unicode 码 点 出 现 的 次 数 。 虽 然 
Unicode 全 部 码 点 的 数量 巨大 ， 但 是 出 现在 特定 文档 中 的 字符 种 类 并 没有 多 少 ， 使 用 map 可 以 
用 比较 自然 的 方式 来 跟踪 那些 出 现 过 字符 的 次 数 。 


gopl.io/ch4/charcount 


// Charcount computes counts of Unicode characters. 
package main 


import ( 
"bufio" 
fm 
Nao" 
Nos" 
"unicode" 
"unicode/utf8" 


func main() { 
counts := make(map[rune]int) // counts of Unicode characters 
var utflen [utf8.UTFMax + i]Jint // count of lengths of UTF-8 encodings 
invalid := 0 // count of invalid UTF-8 characters 


in := bufio.NewReader(os.Stdin) 
for { 
r, n, err := in.ReadRune() // returns rune, nbytes, error 
if err == 10.E0F { 
break 
} 
if err != nil { 
fmt.Fprintf(os.Stderr, "charcount: %v\n", err) 
os.Exit(1) 
} 
if r == unicode.ReplacementChar && n == 1 { 
invalid++ 
continue 
} 
counts[r]++ 
utflen[n]++ 


fmt .Printf("rune\tcount\n") 
for c, n := range counts { 
fmt.Printf("%q\t%d\n", c, n) 


fmt.Print("\nlen\tcount\n") 
for i, n := range utflen { 
ap a oP YE 
fmt.Printf("%d\t%d\n", i, n) 


} 
if invalid > 0 { 
fmt.Printf("\n%d invalid UTF-8 characters\n", invalid) 


ReadRune 方 法 执行 UTF-8 解 码 并 返回 三 个 值 : 解码 的 rune 字 符 的 值 ， 字 符 UTF-8 编 码 后 的 长 
度 ， 和 一 个 错误 值 。 我 们 可 预期 的 错误 值 只 有 对 应 文件 结尾 的 io.EOF。 如 果 输 入 的 是 无 效 的 
UTF-8 编 码 的 字符 ， 返 回 的 将 是 unicode.ReplacementChar 表 示 无 效 字 符 ， 并 且 编 码 长 度 是 
1° 


charcount 程 序 同时 打印 不 同 UTF-8 编 码 长 度 的 字符 数目 。 对 此 ，map 并 不 是 一 个 合适 的 数据 
结构 ; 因为 UTF-8 编 码 的 长 度 总 是 从 1 到 utf8.UTFMax (最 大 是 4 个 字 节 ) ， 使 用 数组 将 更 有 
效 。 


作为 一 个 实验 ， 我 们 用 charcount 程 序 对 英文 版 原稿 的 字符 进行 了 统计 。 虽 然 大 部 分 是 英语 ， 
但 是 也 有 一 些 非 ASCII 字 符 。 下 面 是 排名 前 10 的 非 ASCII 字 符 : 


5 


下 面 是 不 同 UTF-8 编 码 长 度 的 字符 的 数目 : 


len count 
1 765391 
2 60 
3 70 
4 0 


Map 的 value 类 型 也 可 以 是 一 个 聚合 类 型 ， 比 如 是 一 个 map 或 slice。 在 下 面 的 代码 中 ， 图 graph 
的 key 类 型 是 一 个 字符 串 ，value 类 型 map[stringjbool 代 表 一 个 字符 串 集 合 。 从 概念 上 将 ， 
graph 将 一 个 字符 串 类 型 的 key 映 射 到 一 组 相关 的 字符 串 集 合 ， 它 们 指向 新 的 graph 的 key。 


gopl.io/ch4/graph 


var graph = make(map[string]map[string]bool) 


func addEdge(from, to string) { 
edges := graph[from] 
if edges == nil { 
edges = make(map[string]bool) 
graph[from] = edges 
} 
edges[to] = true 


} 


func hasEdge(from, to string) bool { 
return graph[from][to] 
} 


其 中 addEdge 哆 数 惰性 初始 化 map 是 一 个 惯用 方式 ， 也 就 是 说 在 每 个 值 首次 作为 key 时 才 初 始 
化 。addEdge 兄 数 显示 了 如 何 让 map 的 零 值 也 能 正常 工作 ; 即使 ff om 到 to 的 边 不 存在 ， 
graph[from][to] 依 然 可 以 返回 一 个 有 意义 的 结果 。 


练习 4.8: 修改 charcount 程 序 ， 使 用 unicode.lsLetter 等 相关 的 函数 ， 统 计 字母 、 数 字 等 
Unicode 中 不 同 的 字符 类 别 。 

练习 4.9 : 编写 一 个 程序 wordfreq 程 序 ， 报 告 输入 文本 中 每 个 单词 出 现 的 频率 。 在 第 一 次 调用 
Scan 前 先 调用 input.Split(bufio.ScanWords) 函 数 ， 这 样 可 以 按 单词 而 不 是 按 行 输入 。 


4.4, 结构 体 


结构 体 是 一 种 聚合 的 数据 类 型 ， 是 由 零 个 或 多 个 任意 类 型 的 值 聚合 成 的 实体 。 每 个 值 称 为 结 
构 体 的 成 员 。 用 结构 体 的 经 典 案例 处 理 公司 的 员工 信息 ， 每 个 员工 信息 包含 一 个 唯一 的 员工 
编号 、 员 工 的 名 字 、 家 庭 住址 、 出 生日 期 、 工 作 岗 位 、 薪 资 、 上 级 领导 等 等 。 所 有 的 这 些 信 
息 都 需要 绑 定 到 一 个 实体 中 ， 可 以 作为 一 个 整体 单元 被 复制 ， 作 为 函数 的 参数 或 返回 值 ， 或 
者 是 被 存储 到 数组 中 ， 等 等 。 


下 面 两 个 语句 声明 了 一 个 叫 Employee 的 命名 的 结构 体 类 型 ， 并 且 声 明了 一 个 Employee 类 型 的 


变量 dilbert : 


type Employee struct { 


ID int 

Name string 
Address string 
DoB time.Time 


Position string 
Salary int 
ManagerID int 


var dilbert Employee 


dilbert 结 构 体 变量 的 成 员 可 以 通过 点 操作 符 访 问 ， 比 如 djilbertName 和 dilbert.DoB 。 因 为 
dilbert 是 一 个 变量 ， 它 所 有 的 成 员 也 同样 是 变量 ， 我 们 可 以 直接 对 每 个 成 员 赋 值 : 


dilbert.Salary -= 5000 // demoted, for writing too few lines of code 
或 者 是 对 成 员 取 地 址 ， 然 后 通过 指针 访问 : 


position := &dilbert.Position 
*position = "Senior " + *position // promoted, for outsourcing to Elbonia 


点 操作 符 也 可 以 和 指向 结构 体 的 指针 一 起 工作 : 


var employeeOfTheMonth *Employee = &dilbert 
employeeOfTheMonth.Position += " (proactive team player)" 


相当 于 下 面 语句 


(*employeeOfTheMonth).Position += " (proactive team player)" 
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使 用 点 操作 符 来 访问 它 里 面 的 成 员 : 


func EmployeeByID(id int) *Employee { /* ... */ } 
fmt .Println(EmployeeByID(dilbert.ManagerID).Position) // "Pointy-haired boss" 


id := dilbert.ID 
EmployeeByID(id).Salary = © // fired for... no real reason 


后 面 的 语句 通过 EmployeeBylID 和 返回 的 结构 体 指针 更 新 了 Employee 结 构 体 的 成 员 。 如 果 将 
EmployeeByID 有 函数 的 返回 值 从 *Employee 指针 类 型 改 为 Employee 值 类 型 ， 那 么 更 新 语句 将 
不 能 编译 通过 ， 因 为 在 赋值 语句 的 左边 并 不 确定 是 一 个 变量 〈 译 注 : 调用 函数 返回 的 是 值 ， 
并 不 是 一 个 可 取 地 址 的 变量 ) 。 
通常 一 行 对 应 一 个 结构 体 成 员 ， 成 员 的 名 字 在 前 类 型 在 后 ， 不 过 如 果 相 邻 的 成 员 类 型 如 果 相 
同 的 话 可 以 被 合并 到 一 行 ， 就 像 下 面 的 Name 和 Address 成 员 那 样 : 

type Employee struct { 


ID int 
Name, Address string 


DoB time.Time 
Position string 
Salary int 
Manager ID int 


结构 体 成 员 的 输入 顺序 也 有 重要 的 意义 。 我 们 也 可 以 将 Position 成 员 会 并 (因为 也 是 字符 串 类 
型 ) ， 或 者 是 交换 Name 和 Address 出 现 的 先后 顺序 ， 那 样 的 话 就 是 定义 了 不 同 的 结构 体 类 
型 。 通 常 ， 我 们 只 是 将 相关 的 成 员 写 到 一 起 。 


如 果 结 构 体 成 员 名 字 是 以 大 写字 母 开 头 的 ， 那 么 该 成 员 就 是 导出 的 ; 这 是 Go 语言 导出 规则 决 
定 的 。 一 个 结构 体 可 能 同时 包含 导出 和 未 导出 的 成 员 。 


结构 体 类 型 往往 是 宛 长 的 ， 因 为 它 的 每 个 成 员 可 能 都 会 占 一 行 。 虽 然 我 们 每 次 都 可 以 重 写 整 
个 结构 体 成 员 ， 但 是 重复 会 令 人 厌烦 。 因 此 ， 完 整 的 结构 体 写法 通常 只 在 类 型 声明 语句 的 地 
方 出 现 ， 就 像 Employee 类 型 声明 语句 那样 。 

一 个 命名 为 S 的 结构 体 类 型 将 不 能 再 包含 S 类 型 的 成 员 : 因为 一 个 聚合 的 值 不 能 包含 它 自身 。 
(该 限制 同样 适应 于 数组 。) 但 是 S 类 型 的 结构 体 可 以 包含 *s 指针 类 型 的 成 员 ， 这 可 以 让 我 

们 创建 递归 的 数据 结构 ， 上 比如 链表 和 树 结 构 等 。 在 下 面 的 代码 中 ， 我 们 使 用 一 个 二 又 树 来 实 
现 一 个 插入 排序 : 


gopl.io/ch4/treesort 


type tree struct { 
value int 
left, right *tree 


// Sort sorts values in place. 
func Sort(values []Jint) { 
var root *tree 
for _, v := range values { 
root = add(root, v) 
} 


appendValues(values[:0], root) 


// appendValues appends the elements of t to values in order 
// and returns the resulting slice. 
func appendValues(values []Jint, t *tree) []Jint { 
if t !=nil { 
values = appendValues(values, t.left) 
values = append(values, t.value) 
values = appendValues(values, t.right) 


} 


return values 


func add(t *tree, value int) *tree { 
if t == nil { 
// Equivalent to return &tree{value: value}. 
t = new(tree) 
t.value = value 
return t 


} 


if value < t.value { 

t.left = add(t.left, value) 
} else { 

t.right = add(t.right, value) 
} 


return t 


结构 体 类 型 的 零 值 是 每 个 成 员 都 对 是 零 值 。 areal air 最 合理 的 默认 值 。 例 如 ， 对 于 
bytes.Buffer 类 型 ， 结 构 体 初始 值 就 是 一 个 随时 可 用 的 空 缓存 ， 还 有 在 第 9 章 将 会 讲 到 的 
sync.Mutex 的 零 值 也 是 有 效 的 未 锁定 状态 。 有 时 候 这 种 零 a 的 特性 是 自然 获得 的 ， 但 是 
也 有 些 类 型 需要 一 些 额外 的 工作 。 


如 果 结 构 体 没有 任何 成 员 的 话 就 是 空 结构 体 ， 写 作 structf。 它 的 大 小 为 0， 也 不 包含 任何 信 
息 ， 但 是 有 时 候 依然 是 有 价值 的 。 有 些 se 程序 员 用 map 带 模拟 set 数据 结构 时 ， 用 它 来 代 
替 map 中 布尔 类 型 的 value， 只 是 强调 key 的 重要 性 ， 但 是 因为 节约 的 空间 有 限 ， 而 且 语法 比较 
复杂 ， 所 有 我 们 通常 避免 避免 这 样 的 用 法 。 


seen := make(map[string]struct{}) // set of strings 


IE oe 
if _, ok := seen[s]; !ok { 
seen[s] = struct{}{} 
// ...first time seeing s... 
} 


4.4.1. 结构 体面 值 
结构 体 值 也 可 以 用 结构 体面 值 表示 ， 结 构 体 面值 可 以 指定 每 个 成 员 的 值 。 


type Point struct{ X, Y int } 


p := Point{i, 2} 


这 里 有 两 种 形式 的 结构 体面 值 语 法 ， 上 面 的 是 第 一 种 写法 ， 要 求 以 结构 体 成 员 定义 的 顺序 为 
每 个 结构 体 成 员 指定 一 个 面值 。 它 要 求 写 代码 和 读 代 码 的 人 要 记 住 结构 体 的 每 个 成 员 的 类 型 
和 顺序 ， 不 过 结构 体 成 员 有 细微 的 调整 就 可 能 导致 上 述 代码 不 能 编译 。 因 此 ， 上 述 的 语法 一 
般 只 在 定义 结构 体 的 包 内 部 使 用 ， 或 者 是 在 较 小 的 结构 体 中 使 用 ， 这 些 结构 体 的 成 员 排 列 比 
较 规则 ， 比 如 image.Point{x, y} 或 colorRGBA{red, green, blue, alpha} ° 


其 实 更 常用 的 是 第 二 种 写法 ， 以 成 员 名 字 和 相应 的 值 来 初始 化 ， 可 以 包含 部 分 或 全 部 的 成 
员 ， 如 1.4 节 的 Lissajous 程 序 的 写法 : 


anim := gif.GIF{LoopCount: nframes} 


在 这 种 形式 的 结构 体面 值 写法 中 ， 如 果 成 员 被 忽略 的 话 将 默认 用 零 值 。 因 为 ， 提 供 了 成 员 的 
名 字 ， 所 有 成 员 出 现 的 顺序 并 不 重要 。 


两 种 不 同形 式 的 写法 不 能 混合 使 用 。 而 且 ， 你 不 能 企图 在 外 部 包 中 用 第 一 种 顺序 赋值 的 技巧 
来 偷偷 地 初始 化 结构 体 中 未 导出 的 成 员 。 


package p 
type T struct{ a, b int } // a and b are not exported 


package q 
import "p" 
var _ = p.Tf{a: 1, b: 2} // compile error: can't reference a, b 
var _=p.T{1, 2} // compile error: can't reference a, D 


虽然 上 面 最 后 一 行 代码 的 编译 错误 信息 中 并 没有 显 式 提 到 未 导出 的 成 员 ， 但 是 这 样 企 图 隐 式 
使 用 未 导出 成 员 的 行为 也 是 不 允许 的 。 


结构 体 可 以 作为 函数 的 参数 和 返回 值 。 例 如 ， 这 个 Scale 函 数 将 Point 类 型 的 值 缩放 后 返回 : 


func Scale(p Point, factor int) Point { 
return Point{p.X * factor, p.Y * factor} 
} 


fmt.Println(Scale(Point{1, 2}, 5)) // "{5 10}" 
如 果 考 虑 效率 的 话 ， 较 大 的 结构 体 通常 会 用 指针 的 方式 传 入 和 返回 ， 


func Bonus(e *Employee, percent int) int { 
return e.Salary * percent / 100 


} 


如 果 要 在 函数 内 部 修改 结构 体 成 员 的 话 ， 用 指针 传 入 是 必须 的 ; 因为 在 Go 语言 中 ， 所 有 的 函 
数 参 数 都 是 值 拷贝 传 入 的 ， 函 数 参 数 将 不 再 是 函数 调用 时 的 原始 变量 。 


func AwardAnnualRaise(e *Employee) { 
e.Salary = e.Salary * 105 / 100 
} 


因为 结构 体 通常 通过 指针 处 理 ， 可 以 用 下 面 的 写法 来 创建 并 初始 化 一 个 结构 体 变量 ， 并 返回 
结构 体 的 地 址 : 


pp := &Point{i, 2} 
它 是 下 面 的 语句 是 等 价 的 


pp := new(Point) 
*pp = Point{1, 2} 


不 过 &Point{1, 2} 写 法 可 以 直接 在 表达 式 中 使 用 ， 比 如 一 个 函数 调用 。 


4.4.2. 结构 体 比 较 


如 果 结 构 体 的 全 部 成 员 都 是 可 以 比较 的 ， 那 么 结构 体 也 是 可 以 比较 的 ， 那 样 的 话 两 个 结构 体 
将 可 以 使 用 == 或 = 运算 符 进 行 比 较 。 相 等 比较 运 莫 符 == 将 比较 两 个 结构 体 的 每 个 成 员 ， 因 此 
下 面 两 个 比较 的 表达 式 是 等 价 的 : 


type Point struct{ X, Y int } 


p := Point{i, 2} 
q := Point{2, 1} 
fmt.Println(p.X == q.X && p.Y == q.Y) // "false" 
fmt.Println(p == q) Analiset 


可 比较 的 结构 体 类 型 和 其 他 可 比较 的 类 型 一 样 ， 可 以 用 于 map 的 key 类 型 。 


type address struct { 
hostname string 
port int 


hits := make(map[address]int) 
hits[address{"golang.org", 443}]++ 


4.4.3. 结构 体 谨 入 和 匿名 成 员 

在 本 节 中 ， 我 们 将 看 到 如 何 使 用 Go 语言 提供 的 不 同 寻 常 的 结构 体 嵌入 机 制 让 一 个 命名 的 结构 
体 包 含 另 一 个 结构 体 类 型 的 匿名 成 员 ， 这 样 就 可 以 通过 简单 的 点 运算 符 Xf 来 访问 匿名 成 员 链 
中 嵌 套 的 x.d.e.f 成 员 。 


考虑 一 个 二 维 的 绘图 程序 ， 提 供 了 一 个 各 种 图 形 的 库 ， 例 如 短 形 、 椭 圆 形 、 星 形 和 轮 形 等 几 
何 形 状 。 这 里 是 其 中 两 个 的 定义 : 


type Circle struct { 
X, Y, Radius int 


type Wheel struct { 
X, Y, Radius, Spokes int 


一 个 Circle 代 表 的 圆 形 类 型 包含 了 标准 圆心 的 X 和 Y 坐 标 信 息 ， 和 一 个 Radius 表 示 的 半径 信 
息 。 一 个 Wheel 轮 形 除了 包含 Circle 类 型 所 有 的 全 部 成 员外 ， 还 增加 了 Spokes 表 示 径 向 辐 条 的 
数量 。 我 们 可 以 这 样 创建 一 个 wheel 交 量 : 


var w Wheel 


W.X= 8 
w.Y = 8 
w.Radius = 5 
w.Spokes = 20 


随 着 库 中 几何 形状 数量 的 增多 ， 我 们 一 定 会 注意 到 它们 之 间 的 相似 和 重复 之 处 ， 所 以 我 们 可 
能 为 了 便于 维护 而 将 相同 的 属性 独立 出 来 : 


type Point struct { 
X, Y int 
} 


type Circle struct { 
Center Point 
Radius int 


} 


type Wheel struct { 
Circle Circle 
Spokes int 


这 样 改 动 之 后 结构 体 类 型 变 的 清晰 了 ， 但 是 这 种 修改 同时 也 导致 了 访问 每 个 成 员 变 得 繁琐 : 


var w Wheel 


w.Circle.Center. 
.Circle.Center. 


Il < x 
oa Ill 


Ww 
w.Circle.Radius 
w.Spokes = 20 


Go 语言 有 一 个 特性 让 我 们 只 声明 一 个 成 员 对 应 的 数据 类 型 而 不 指名 成 员 的 名 字 ; 这 类 成 员 就 
叫 匿名 成 员 。 匿 名 成 员 的 数据 类 型 必须 是 命名 的 类 型 或 指向 一 个 命名 的 类 型 的 指针 。 下 面 的 

代码 中 ，Circle 和 Wheel 各 自 都 有 一 个 匿名 成 员 。 我 们 可 以 说 Point 类 型 被 诅 入 到 了 Circle 结 构 
体 ， 同 时 Circle 类 型 被 谋 入 到 了 Wheel 结 构 体 。 


type Circle struct { 
Point 
Radius int 


} 

type Wheel struct { 
Circle 
Spokes int 


导 意 于 匿名 网 入 的 特性 ， 我 们 可 以 直接 访问 叶子 属性 而 不 需要 给 出 完整 的 路 径 : 


Ss 


var w Wheel 


w.X = 8 // equivalent to w.Circle.Point.X = 8 
w.Y = 8 // equivalent to w.Circle.Point.Y = 8 
w.Radius = 5 // equivalent to w.Circle.Radius = 5 


w.Spokes = 20 





的 无 法 访问 了 。 其 中 匿名 成 员 Circle 和 Point 都 有 自己 的 名 字 
这 些 名 字 在 点 操作 符 中 是 可 选 的 。 我 们 在 访问 子 成 员 的 时 候 可 以 忽略 任何 匿名 成 员 部 分 。 


不 幸 的 是 ， 结 构 体 字面 值 并 没有 简短 表示 匿名 成 员 的 语法 ， 因 此 下 面 的 语句 都 不 能 编译 通 
过 : 


= 
I 


Wheel{8, 8, 5, 20} // compile error: unknown fields 
w = Wheel{X: 8, Y: 8, Radius: 5, Spokes: 20} // compile error: unknown fields 


结构 体 字 面值 必须 遵循 形状 类 型 声明 时 的 结构 ， 所 以 我 们 只 能 用 下 面 的 两 种 语法 ， 它 们 彼此 
是 等 价 的 : 


gopl.io/ch4/embed 


w = Wheel{Circle{Point{8, 8}, 5}, 20} 


w = Wheel{ 
Circle: Circle{ 
Point: Point{X: 8, Y: 8}, 
Radius: 5, 
}, 


Spokes: 20, // NOTE: trailing comma necessary here (and at Radius) 


fmt .Printf("%#v\n", w) 
// Output: 
// Wheel{Circle:Circle{Point:Point{X:8, Y:8}, Radius:5}, Spokes:20} 


w.X = 42 
fmt .Printf("%#v\n", w) 


// Output: 
// Wheel{Circle:Circle{Point:Point{X:42, Y:8}, Radius:5}, Spokes:20} 


需要 注意 的 是 Printf 函 数 中 %v 参 数 包含 的 # 副 词 ， 它 表示 用 和 Go 语言 类 似 的 语法 打印 值 。 对 二 
结构 体 类 型 来 说 ， 将 包含 每 个 成 员 的 名 字 。 


因为 匿名 成 员 也 有 一 个 隐 式 的 名 字 ， 因 此 不 能 同时 包含 两 个 类 型 相同 的 匿名 成 员 ， 这 会 导致 
名 字 冲 突 。 同 时 ， 因 为 成 员 的 名 字 是 由 其 类 型 隐 式 地 决定 的 ， 所 有 匿名 成 员 也 有 可 见 性 的 规 
则 约束 。 在 上 面 的 例子 中 ，Point 和 Circle 匿 名 成 员 都 是 导出 的 。 即 使 它们 不 导出 (比如 改 成 小 
写字 母 开头 的 point 和 Ccircle) ， 我 们 依然 可 以 用 简短 形式 访问 匿名 成 员 诅 套 的 成 员 


w.X = 8 // equivalent to w.circle.point.X = 8 


但 是 在 包 外 部 ， 因 为 circle 和 point 没 有 导出 不 能 访问 它们 的 成 员 ， 因 此 简短 的 匿名 成 员 访 问 语 
法 也 是 禁止 的 。 


到 目前 为 止 ， 我 们 看 到 匿名 成 员 特性 只 是 对 访问 谋 套 成 员 的 点 运算 符 提 供 了 简短 的 语法 糖 。 
稍 后 ， 我 们 将 会 看 到 匿名 成 员 并 不 要 求 是 结构 体 类 型 ; 其 实 任何 命名 的 类 型 都 可 以 作为 结构 
体 的 匿名 成 员 。 但 是 为 什么 要 刻 入 一 个 没有 任何 子 成 员 类 型 的 匿名 成 员 类 型 呢 ? 


答案 是 匿名 类 型 的 方法 集 。 简 短 的 点 运算 符 语法 可 以 用 于 选择 匿名 成 员 诅 套 的 成 员 ， 也 可 以 
用 于 访问 它们 的 方法 。 实 际 上 ， 外 层 的 结构 体 不 仅仅 是 获得 了 匿名 成 员 类 型 的 所 有 成 员 ， 而 
且 也 获得 了 该 类 型 导出 的 全 部 的 方法 。 这 个 机 制 可 以 用 于 将 一 个 有 简单 行为 的 对 象 组 合成 有 
复杂 行为 的 对 象 。 组 合 是 Go 语言 中 面向 对 象 编程 的 核心 ， 我 们 将 在 6.3 节 中 专门 讨论 。 


4.5. JSON 


JavaScripts! RR KKH (ISON) 是 一 种 用 于 发 送 和 接收 结构 化 信息 的 标准 协议 。 在 类 似 的 协 
议 中 ，JSON 并 不 是 唯一 的 一 个 标准 协议 。 XML (§7.14) 、ASN.1 和 Google 的 Protocol 
Buffers 都 是 类 似 的 协议 ， 并 且 有 各 自 的 特色 ， 但 是 由 于 简洁 性 、 可 读 性 和 流行 程度 等 原因 ， 
JSON 是 应 用 最 广泛 的 一 个 。 


Go 语言 对 于 这 些 标准 格式 的 编码 和 解码 都 有 良好 的 支持 ， 由 标准 库 中 的 encoding/json、 
encoding/xml、encoding/asn1 等 包 提供 支持 (译注 : Protocol Buffers 的 支持 由 
github.com/golang/protobuf 包 提 供 ) ， 并 且 这 类 包 都 有 着 相似 的 API 接 口 。 本 节 ， 我 们 将 对 
重要 的 encoding/json 包 的 用 法 做 个 概述 。 


JSON 是 对 JavaScript 中 各 种 类 型 的 值 一 一 字符 囊 、 数 字 、 布 尔 值 和 对 象 一 一 Unicode 本 文 纺 
码 。 它 可 以 用 有 效 可 读 的 方式 表示 第 三 章 的 基础 数据 类 型 和 本 章 的 数组 、slice、 结 构 体 和 
map 等 聚合 数据 类 型 。 


基本 的 JSON 类 型 有 数字 (十 进 制 或 科学 记 数 法 ) 、 布 尔 值 (true 或 false ) 、 字 符 串 ， 其 中 字 
符 串 是 以 双 引 号 包含 的 Unicode 字 符 序 列 ， 支 持 和 Go 语言 类 似 的 反 斜 杠 转 义 特性 ， 不 过 JSON 
使 用 的 是 \Uhhhh 转 义 数 字 来 表示 一 个 UTF-16 编 码 (译注 : UTF-16 和 UTF-8 一 样 是 一 种 变 长 的 
编码 ， 有 些 Unicode 码 点 较 大 的 字符 需要 用 4 个 字 节 表示 ; 而 且 UTF-16 还 有 大 端 和 小 端的 问 
题 ) ， 而 不 是 Go 语言 的 rune 类 型 。 


这 些 基 础 类 型 可 以 通过 JSON 的 数组 和 对 象 类 型 进行 递归 组 合 。 一 个 JSON 数 组 是 一 个 有 序 的 
值 序列 ， 写 在 一 个 方 括号 中 并 以 过 号 分 隔 ; 一 个 JSON 数 组 可 以 用 于 编码 Go 语言 的 数组 和 
slice。 一 个 JSON 对 象 是 一 个 字符 串 到 值 的 映射 ， 写 成 以 系列 的 name:value 对 形式 ， 用 花 括 号 
包含 并 以 去 号 分 隔 ; JSON 的 对 象 类 型 可 以 用 于 编码 Go 语言 的 map 类 型 (key 类 型 是 字符 囊 ) 
和 结构 体 。 例 如 : 


boolean true 
number -273.15 
String "She said \"Hello, BF\"" 
array ["gold", "silver", "bronze"] 
object {"year": 1980, 
"event": "archery", 
"medals": ["gold", "silver", "bronze" ]} 


考虑 一 个 应 用 程序 ， 该 程序 负责 收集 各 种 电影 评论 并 提供 反馈 功能 。 它 的 Movie 数 据 类 型 和 一 
个 典型 的 表示 电影 的 值 列表 如 下 所 示 。 (在 结构 体 声明 中 ，Year 和 Color 成 员 后 面 的 字符 串 面 
值 是 结构 体 成 员 Tag ; 我 们 稍 后 会 解释 它 的 作用 。) 


gopl.io/ch4/movie 


type Movie struct { 
Title string 
Year int Json “released 
Color bool `json:"color,omitempty"` 
Actors []string 


var movies = []Movie{ 
{Title: "Casablanca", Year: 1942, Color: false, 
Actors: []string{"Humphrey Bogart", "Ingrid Bergman"}}, 
{Title: "Cool Hand Luke", Year: 1967, Color: true, 
Actors: []string{"Paul Newman"}}, 
{Title: "Bullitt", Year: 1968, Color: true, 
Actors: []string{"Steve McQueen", "Jacqueline Bisset"}}, 
Ue seit 


这 样 的 数据 结构 特别 适合 JSON 格 式 ， 并 且 在 两 种 之 间 相 互 转换 也 很 容易 。 将 一 个 Go 语言 中 
类 似 movies 的 结构 体 slice 转 为 JSON 的 过 程 叫 编组 《marshaling) 。 编 组 通过 调用 
json.Marshal 函 数 完成 : 


data, err := json.Marshal(movies) 
if err != nil { 
log.Fatalf("JSON marshaling failed: %s", err) 


} 
fmt.Printf("%s\n", data) 


Marshal 函 数 返 还 一 个 编码 后 的 字 节 slice ， 包 含 很 长 的 字符 事 ， 并 且 没 有 空白 缩 进 ; 我 们 将 它 
折 行 以 便于 显示 : 


[{"Title": "Casablanca", "released":1942, "Actors": ["Humphrey Bogart", "Ingr 
id Bergman"]},{"Title":"Cool Hand Luke", "released":1967, "color": true, "Ac 
tors": ["Paul Newman"]}, {"Title": "Bullitt", "released":1968, "color":true," 
Actors": ["Steve McQueen", "Jacqueline Bisset"]}] 


这 种 紧凑 的 表示 形式 虽然 包含 了 全 部 的 信息 ， 但 是 很 难 阅读 。 为 了 生成 便于 阅读 的 格式 ， 另 
Be oad ee RRA TR 
示 每 一 行 输出 的 前 级 和 每 一 个 层级 的 缩 


data, err := json.MarshalIndent(movies, "", " a) 
if err != nil { 
log.Fatalf("JSON marshaling failed: %s", err) 


} 
fmt.Printf("%s\n", data) 


上 面 的 代码 将 产生 这 样 的 输出 (译注 : 在 最 后 一 个 成 员 或 元 素 后 面 并 没有 运 号 分隔 符 


"Title": "Casablanca", 
"released": 1942, 
"Actors": [ 
"Humphrey Bogart", 
"Ingrid Bergman" 


"Title": "Cool Hand Luke", 
"released": 1967, 
"color": true, 
VAGEORS I] 
"Paul Newman" 


国人 攻略 罗拉 可 本 
"released": 1968, 
“color: true, 
VAGEORS 2 [I 
"Steve McQueen", 
"Jacqueline Bisset" 


在 编码 时 ， 黑 认 使 用 Go 语言 结构 体 的 成 员 名 字 作 为 JSON 的 对 象 〈 通 过 reflect 反 射 技术 ， 我 们 
将 在 12.6 节 讨论 ) 。 只 有 导出 的 结构 体 成 员 才 会 被 编码 ， 这 也 就 是 我 们 为 什么 选择 用 大 写字 
母 开头 的 成 员 名 称 。 


细心 的 读者 可 能 已 经 注意 到 ， 其 中 Year 名 字 的 成 员 在 编码 后 变 成 了 released， 还 有 Color 成 员 
编码 后 变 成 了 小 写字 母 开 头 的 color。 这 是 因为 构 体 成 员 Tag 所 导致 的 。 一 个 构 体 成 员 Tag 是 和 
在 编译 阶段 关联 到 该 成 员 的 元 信息 字符 串 : 


Year int “json:"released". 
Color bool ~json:"color,omitempty"~ 


结构 体 的 成 员 Tag 可 以 是 任意 的 字符 串 面 值 ， 但 是 通常 是 一 系列 用 空格 分 隔 的 key:"value" 键 值 
对 序列 ; 因为 值 中 含义 双 引 号 字符 ， 因 此 成 员 Tag 一 般 用 原生 字符 串 面值 的 形式 书写 。json 开 
头 键 名 对 应 的 值 用 于 控制 encoding/json 包 的 编码 和 解码 的 行为 ， 并 且 encoding/... 下 面 其 它 的 
包 也 遵循 这 个 约定 。 成 员 Tag 中 json 对 应 值 的 第 一 部 分 用 于 指定 JSON 对 象 的 名 字 ， 比 如 将 Go 


语言 中 的 TotalCount 成 员 对 应 到 JSON 中 的 total_count 对 象 。Color 成 员 的 Tag 还 带 了 一 个 额外 
的 omitempty 选 项 ， 表 示 当 Go 语言 结构 体 成 员 为 空 或 零 值 时 不 生成 JSON 对 象 〈《 这 里 false 为 零 
值 ) 。 果 然 ，Casablanca 是 一 个 黑白 电影 ， 并 没有 输出 Color 成 员 。 


编码 的 逆 操 作 是 解码 ， 对 应 将 JSON 数 据 解码 为 Go 语言 的 数据 结构 ，Go 语 言 中 一 般 叫 
unmarshaling ， Ra UN 下 面 的 代码 将 JSON 格 式 的 电影 数据 解码 为 一 
个 结构 体 slice， 结 构 体 中 只 有 Title 成 员 。 通 过 定义 合适 ae 言 数据 结构 ， 我 们 可 以 选择 性 
地 解码 JSON 中 感 兴趣 的 成 员 。 当 Unmarshal 函 数 调 用 返回 ，slice 将 被 只 含有 Title 信 息 值 填 
充 ， 其 它 JSON 成 员 将 被 忽略 。 


var titles []struct{ Title string } 

if err := json.Unmarshal(data, &titles); err != nil { 
log.Fatalf("JSON unmarshalling failed: %s", err) 

} 


fmt.Println(titles) // "[{Casablanca} {Cool Hand Luke} {Bullitt}]" 


许多 Web 服务 都 提供 JSON 接 口 ， 通 过 HTTP 接 口 发 送 JSON 格 式 请 求 并 返回 JSON 格 式 的 信 
息 。 为 了 说 明 这 一 点 ， 我 们 通过 Github 的 issue 查 询 服 务 来 演示 类 似 的 用 法 。 首 先 ， 我们 要 定 


gopl.io/ch4/github 


// Package github provides a Go API for the GitHub issue tracker. 
// See https://developer.github.com/v3/search/#search-issues. 
package github 

import "time" 


const IssuesURL = "https://api.github.com/search/issues" 


type IssuesSearchResult struct { 
TotalCount int ~json:"total_count"~ 


Items []*Issue 
} 
type Issue struct { 
Number int 
HTMLURL string ~json:"html_url"~ 
Title string 
State string 
User *User 


CreatedAt time.Time ~json:"created_at"” 
Body string // in Markdown format 


type User struct { 
Login string 
HTMLURL string ~json:"html_url"- 


和 前 面 一 样 ， 即 使 对 应 的 JSON 对 象 名 是 小 写字 母 ， 每 个 结构 体 的 成 员 名 也 是 声明 为 大 小 字母 
开头 的 。 因 为 有 些 JSON 成 员 名 字 和 Go 结构 体 成 员 名 字 并 不 相同 ， 因 此 需要 Go 语言 结构 体 成 
员 Tag 来 指定 对 应 的 JSON 名 字 。 同 样 ， 在 解码 的 时 候 也 需要 做 同样 的 处 理 ，GitHub 服 务 返回 
的 信息 比 我 们 定义 的 要 多 很 多 。 


Searchlssues 雹 数 发 出 一 个 HTTP 请 求 ， 然 后 解码 返回 的 JSON 格 式 的 结果 。 因 为 用 户 提 供 的 
查询 条 件 可 能 包含 类 似 2 和 & 之 类 A 符 ， 为 了 避免 对 URL 造 成 冲突 ， 我 们 用 
url.QueryEscape 来 对 查询 中 的 特殊 字符 进行 转 义 操作 。 


gopl.io/ch4/github 


package github 


import ( 
"encoding/json" 
"Fmt" 
nev, het pe 
"net/url" 
Sita pelnG Sig 


// SearchIssues queries the GitHub issue tracker. 
func SearchIssues(terms []string) (*IssuesSearchResult, error) { 
q := url.QueryEscape(strings.Join(terms, " ")) 
resp, err := http.Get(IssuesURL + "?q=" + q) 
if err != nil { 
return nil, err 


// We must close resp.Body on all execution paths. 
// (Chapter 5 presents 'defer', which makes this simpler.) 
if resp.StatusCode != http.StatusoK { 
resp.Body.Close() 
return nil, fmt.Errorf("search query failed: %s", resp.Status) 


var result IssuesSearchResult 

if err := json.NewDecoder(resp.Body).Decode(&result); err != nil { 
resp.Body.Close() 
return nil, err 


} 
resp.Body.Close() 


return @&result, nil 


在 早 些 的 例子 中 ， 我 们 使 用 了 json.Unmarshal 函 数 来 将 JSON 格 式 的 字符 串 解码 为 字 节 slice。 
但 是 这 个 例子 中 ， 我 们 使 用 了 基于 流 式 的 解码 器 json.Decoder， 它 可 以 从 一 个 输入 流 解码 
JSON 数 据 ， 尽 管 这 不 是 必须 的 。 如 您 所 料 ， 还 有 一 个 针对 输出 流 的 json.Encoder 编 码 对 象 。 


我 们 调用 Decode 方 法 来 填充 变量 。 这 里 有 多 种 方法 可 以 格式 化 结构 。 下 面 是 最 简单 的 一 种 ， 
以 一 个 国定 宽度 打印 每 个 issue， 但 是 在 下 一 节 我 们 将 看 到 如 果 利 用 模板 来 输出 复杂 的 格式 。 


gopl.io/ch4/issues 


// Issues prints a table of GitHub issues matching the search terms. 


package main 


import ( 
ATIE 
"log" 
Nos" 


"gopl.io/ch4/github" 


) 
func main() { 
result, err := github.SearchIssues(os.Args[i:]) 
if err != nil { 
log.Fatal(err) 
} 
fmt.Printf("%d issues:\n", result.TotalCount) 
for _, item := range result.Items { 
fmt.Printf("#%-5d %9.9s %.55s\n", 
item.Number, item.User.Login, item.Title) 
} 
} 
通过 命令 行 参 数 指定 检索 条 件 。 下 面 的 命令 是 查询 Go 语言 项 目 中 和 JSON 解 码 相关 的 问题 ， 
还 有 查询 返回 的 结果 


$ go build gopl.io/ch4/issues 

$ ./issues repo:golang/go is:open json decoder 

13 issues: 

#5680 eaigner encoding/json: set key converter on en/decoder 

#6050 gopherbot encoding/json: provide tokenizer 

#8658 gopherbot encoding/json: use bufio 

#8462 kortschak encoding/json: UnmarshalText confuses json.Unmarshal 
#5901 rsc encoding/json: allow override type marshaling 

#9812 klauspost encoding/json: string tag not symmetric 

#7872 extempora encoding/json: Encoder internally buffers full output 
#9650 cespare encoding/json: Decoding gives errPhase when unmarshalin 
#6716 gopherbot encoding/json: include field name in unmarshal error me 
#6901 lukescott encoding/json, encoding/xml: option to treat unknown fi 
#6384 joeshaw encoding/json: encode precise floating point integers u 
#6647 btracey x/tools/cmd/godoc: display type kind of each named type 
#4237 gjemiller encoding/base64: URLEncoding padding is optional 


GitHub 49 WebjR %4 7 https://developer.github.com/v3/ 包含 了 更 多 的 特性 。 


练习 4.10 : 修改 issues 程 序 ， 根 据 问题 的 时 间 进 行 分 类 ， 上 比如 不 到 一 个 月 的 、 不 到 一 年 的 、 
超过 一 年 。 


练习 4.11 : 编写 一 个 工具 ， 允 许 用 户 在 命令 行 创建 、 读 取 、 更 新 和 关闭 GitHub 上 的 issue， 当 
必要 的 时 候 自 动 打开 用 户 默 认 的 编辑 器 用 于 输入 文本 信息 。 


练习 4.12: 流行 的 web 漫 画 服 务 xkcd 也 提供 了 JSON 接 口 。 例 如 ， 一 个 
https://xkcd.com/571/info.0.json 请 求 将 返回 一 个 很 多 人 喜爱 的 571 编 号 的 详细 描述 。 下 载 每 
个 链接 (只 下 载 一 次 ) 然后 创建 一 个 离线 索引 。 编 写 一 个 xkcd 工 具 ， 使 用 这 些 离线 索引 ， 打 
印 和 命令 行 输入 的 检索 词 相 匹配 的 漫画 的 URL 。 


练习 4.13 : 使 用 开放 电影 数据 库 的 JSON 服 务 接口 ， 允 许 你 检索 和 下 载 https://omdbapi.com/ 
上 电影 的 名 字 和 对 应 的 海报 图 像 。 编 写 一 个 poster 工 具 ， 通 过 命令 行 输 入 的 电影 名 字 ， 下 载 对 
应 的 海报 。 


4.6. 文本 和 HTML 模 板 


前 面 的 例子 ， 只 是 最 简单 的 格式 化 ， 使 用 Printf 是 完全 足够 的 。 但 是 有 时 候 会 需要 复杂 的 打印 
格式 ， 这 时 候 一 般 需要 将 格式 化 代码 分 离 出 来 以 便 更 安全 地 修改 。 这 写 功 能 是 由 text/template 
和 htmltemplate 等 模板 包 提 供 的 ， 它 们 提供 了 一 个 将 变量 值 填充 到 一 个 文本 或 HTML 格 式 的 模 
板 的 机 制 。 


一 个 模板 是 一 个 字符 串 或 一 个 文件 ， 里 面包 含 了 一 个 或 多 个 由 双 花 括号 包含 的 ffaction}} 对 
象 。 大 部 分 的 字符 串 只 是 按 面值 打印 ， 但 是 对 于 actions 部 分 将 触发 其 它 的 行为 。 每 个 actions 
都 包含 了 一 个 用 模板 语言 书写 的 表达 式 ， 一 个 action 虽 然 简 短 但 是 可 以 输出 复杂 的 打印 值 ， 模 
板 语 言 包 含 通过 选择 结构 体 的 成 员 、 调 用 函数 或 方法 、 表 达 式 控制 流 if-else 语 句 和 range 循 环 
语句 ， 还 有 其 它 实 例 化 模板 等 诸多 特性 。 下 面 是 一 个 简单 的 模板 字符 串 : 


gopl.io/ch4/issuesreport 


const templ = “{{.TotalCount}} issues: 

{{range .Items}}---------------------------------------- 
Number: {{.Number}} 

User: {{.User.Login}} 

Titles Seances un dS) 

Age: {{.CreatedAt | daysAgo}} days 

{{end}}` 


这 个 模板 先 打 印 匹 配 到 的 issue 总 数 ， 然 后 打印 每 个 issue 的 编号 、 创 建 用 户 、 标 题 还 有 存在 的 
时 间 。 对 于 每 一 个 action， 都 有 一 个 当前 值 的 概念 ， 对 应 点 操作 符 ， 写 作 “.”。 当 前 值 "." 最 初 被 
初始 化 为 调用 模板 是 的 参数 ， 在 当前 例子 中 对 应 github.IlssuesSearchResult 类 型 的 变量 。 模 板 
中 {{.Totalcount}} 对 应 action 将 展开 为 结构 体 中 TotalCount 成 员 以 默认 的 方式 打印 的 值 。 模 
板 中 {frange .Items}} 和 {fend}} 对 应 一 个 循环 action， 因 此 它们 直接 的 内 容 可 能 会 被 展开 多 
次 ， 循 环 每 次 迭代 的 当前 值 对 应 当前 的 ltems 元 素 的 值 。 


在 一 个 action 中 ， | 操作 符 表 示 将 前 一 个 表达 式 的 结果 作为 后 一 个 函数 的 输入 ， 类 似 于 UNIX 
中 管道 的 概念 。 在 Title 这 一 行 的 action 中 ， 第 二 个 操作 是 一 个 printf 函 数 ， 是 一 个 基于 
fmt.Sprintf 实 现 的 内 置 函 数 ， 所 有 模板 都 可 以 直接 使 用 。 对 于 Age 部 分 ， 第 二 个 动作 是 一 个 叫 
daysAgo 的 函数 ， 通 过 time.Since 有 函数 将 CreatedAt 成 员 转 换 为 过 去 的 时 间 长 度 : 


func daysAgo(t time.Time) int { 
return int(time.Since(t).Hours() / 24) 


} 


需要 注意 的 是 CreatedAt 的 参数 类 型 是 time.Time， 并 不 是 字符 串 。 以 同样 的 方式 ， 我 们 可 以 通 
过 定义 一 些 方法 来 控制 字符 串 的 格式 化 (§2.5) ， 一 个 类 型 同样 可 以 定制 自己 的 JSON 编 码 和 
解码 行为 。time.Time 类 型 对 应 的 JSON 值 是 一 个 标准 时 间 格 式 的 字符 串 。 


生成 模板 的 输出 需要 两 个 处 理 步骤 。 步 是 要 分 析 模 板 并 转 为 内 部 表示 ， 然 后 基于 指定 的 
输入 执行 模板 。 分 析 模 板 部 分 一 般 只 a nal o 下面 的 代码 创建 并 分 析 上 面 定 义 的 模板 
templ ° 注意 方法 调用 链 的 顺序 : template.New 先 创建 并 返回 一 个 模板 ; Funcs 方 法 将 
daysAgo 等 自 定 义 函 数 注册 到 模板 中 ， 并 返回 模板 ; IGA Parse BAD A RUM © 


report, err := template.New("report"). 
Funcs(template.FuncMap{"daysAgo": daysAgo}). 
Parse(templ) 

if err != nil { 
log.Fatal(err) 

} 


因为 模板 通常 在 编译 时 就 测试 好 了 ， 如 果 模 板 解析 失败 将 是 一 个 致命 的 错误 。template.Must 
辅助 函数 可 以 简化 这 个 致命 错误 的 处 理 : 它 接受 一 个 模板 和 一 个 error 类 型 的 参数 ， 检 测 error 
是 否 为 nil (如 果 不 是 nil 则 发 出 panic 弄 常 ) ， 然 后 返回 传 入 的 模板 。 我 们 将 在 5.9 节 再 讨论 这 个 


话题 。 


一 旦 模板 已 经 创建 、 注 册 了 daysAgo 函 数 、 并 通过 分 析 和 检测 ， 我 们 就 可 以 使 用 
github.lssuesSearchResult 作 为 输入 源 、os.Stdout 作 为 输出 源 来 执行 模板 : 


var report = template.Must(template.New("issuelist"). 
Funcs(template.FuncMap{"daysAgo": daysAgo}). 
Parse(temp1) ) 


func main() { 
result, err := github.SearchIssues(os.Args[i:]) 
if err != nil { 
log.Fatal(err) 


} 

if err := report.Execute(os.Stdout, result); err != nil { 
log.Fatal(err) 

} 


程序 输出 一 个 纯 文本 报告 : 


$ go build gopl.io/ch4/issuesreport 
$ ./issuesreport repo:golang/go is:open json decoder 
13 issues: 


Number: 5680 


User: eaigner 
tiie: encoding/json: set key converter on en/decoder 
Age: 750 days 


Number: 6050 


User: gopherbot 
Title: encoding/json: provide tokenizer 
Age: 695 days 


现在 让 我 们 转 到 html/template 模 板 包 。 它 使 用 和 text/template 包 相同 的 API 和 模板 语言 ， 但 是 
增加 了 一 个 将 字符 串 自动 转 义 特性 ， 这 可 以 避免 输入 字符 串 和 HTML、JavaScript、CSS 或 
URL 语 法 产生 冲突 的 问题 。 这 个 特性 还 可 以 避免 一 些 长 期 存在 的 安全 问题 ， 比 如 通过 生成 
HTML 注 入 攻击 ， 通 过 构造 一 个 含有 恶意 代码 的 问题 标题 ， 这 些 都 可 能 让 模板 输出 错误 的 输 
出 ， 从 而 让 他 们 控制 页 面 。 


下 面 的 模板 以 HTML 格 式 输 出 issue 列 表 。 注 意 import 语 句 的 不 同 : 
gopl.io/ch4/issueshtml 


import "html/template" 


var issueList = template.Must(template.New("issuelist").Parse(—~ 
<hi>{{.TotalCount}} issues</hi> 
<table> 
<tr style='text-align: left'> 
<th>#</th> 
<th>State</th> 
<th>User</th> 
<th>Title</th> 
</tr> 
{{range .Items}} 
<tr> 
<td><a href='{{.HTMLURL}}'>{{.Number}}</a></td> 
<td>{{.State}}</td> 
<td><a href='{{.User.HTMLURL}}'>{{.User.Login}}</a></td> 
<td><a href='{{.HTMLURL}}'>{{.Title}}</a></td> 
</tr> 
{{end}} 
</table> 


)) 


下 面 的 命令 将 在 新 的 模板 上 执行 一 个 稍微 不 同 的 查询 : 


$ go build gopl.io/ch4/issueshtml 
$ ./issueshtml repo:golang/go commenter:gopherbot json encoder >issues.html 


图 4.4 显 示 了 在 web 浏览 器 中 的 效果 图 。 每 个 issue 包 含 到 Github 对 应 页 面 的 链接 。 


mes Niml 


+C fileyWhome/gopheryissues_html 


17 issues 


着 State User Title 

7872 open exiemporalgenome encoding/json: Encoder internally buffers full output 

5683 open gopherbot encoding/json; performance slower than expected 

6901 open jukescott encoding/json, encoding/xm option to treat unknown fields as an error 





Figure 4.4. An HTML table of Go project issues relating to JSON encoding. 


图 4.4 中 issue 没 有 包含 会 对 HTML 格 式 产生 冲突 的 特殊 字符 ， 但 是 我 们 马上 将 看 到 标题 中 含 
A a 和 < 字符 的 issue。 下 面 的 命令 选择 了 两 个 这 样 的 issue : 


$ ./issueshtml repo:golang/go 3133 10535 >issues2.html 


图 4.5 显 示 了 该 查询 的 结果 。 注 意 ，html/template 包 已 经 自动 将 特殊 字符 转 义 ， 因 此 我 们 依然 
可 以 看 到 正确 的 字面 值 。 ee a 的 话 ， 这 2 个 issue 将 会 产生 错误 ， 其 
中 “&lt;” 四 个 字符 将 会 被 当 作 小 于 字符 “<” 处 理 ， 同 时 “<link>” 字 符 串 将 会 被 当 作 一 个 链接 元 素 处 
理 ， 它们 都 会 导致 HTML 文 档 结构 的 改变 ， 从 而 导致 有 未 知 的 风险 。 


我 们 也 可 以 通过 对 信任 的 HTML 字 符 串 使 用 template.HTML 类 型 来 抑制 这 种 自动 转 义 的 行为 。 

还 有 很 多 采用 类 型 命名 的 字符 串 类 型 分 别 对 应 信任 的 JavaScript、 SA 下 面 的 程序 演 
示 了 两 个 使 用 不 同类 型 的 相同 字符 串 产生 的 不 同 结果 : A 是 一 个 普通 字符 串 ，B 是 一 个 信任 的 
template.HTML 字 符 串 类 型 。 
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issues? mrri x 


所 C fi file:///nome/gopher/issues2,htmi 


2 issues 


2 State User Title 


3133 closed ukai htmi/template: escape xmidese as &lt;?xml 
10535 open dvyukov x/net/huml; void element <link> has child nodes 


Figure 4.5. HTML metacharacters in issue titles are correctly displayed. 


gopl.io/ch4/autoescape 


func main() { 
const templ = ~<p>A: {{.A}}</p><p>B: {{.B}}</p>- 
t := template.Must(template.New("escape").Parse(templ) ) 
var data struct { 
A string // untrusted plain text 
B template.HTML // trusted HTML 


} 

data.A = "<b>Hello!</b>" 

data.B = "<b>Hello!</b>" 

if err := t.Execute(os.Stdout, data); err != nil { 
log.Fatal(err) 


图 4.6 显 示 了 出 现在 浏览 器 中 的 模板 输出 。 我 们 看 到 A 的 黑体 标记 被 转 义 失效 了 ， 但 是 B 没 有 。 


autoescapehtm! x 
€ C fi file:///nome/gopher/gobook/autoescape. html 
A: <b>Hello!</b> 


B: Hello! 


Figure 4.6. String values are HTML-escaped but template.HTML values are not. 


我 们 这 里 只 讲述 了 模板 系统 中 最 基本 的 特性 。 一 如 既往 ， 如 果 想 了 解 更 多 的 信息 ， 请 自己 查 
看 包 文 档 : 


$ go doc text/template 
$ go doc htm1l/template 


练习 4.14 : 创建 一 个 web 服 务 器 ， 查 询 一 次 GitHub， 然 后 生成 BUG 报告 、 里 程 碑 和 对 应 的 用 
户 信息 。 
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大 大 oF < 
第 五 草 yy Be 


函数 可 以 让 我 们 将 一 个 语句 序 列 打包 为 一 个 单元 ， 然 后 可 以 从 程序 中 其 它 地 方 多 次 调用 。 函 
数 的 机 制 可 以 让 我 们 将 一 个 大 的 工作 分 解 为 小 的 任务 ， 这 样 的 小 任务 可 以 让 不 同 程序 员 在 不 
同时 间 、 不 同 地 方 独立 完成 。 一 个 函数 同时 对 用 户 隐藏 了 其 实现 细节 。 由 于 这 些 因 素 ， 对 于 
任何 编程 语言 来 说 ， 函 数 都 是 一 个 至 关 重要 的 部 分 。 


我 们 已 经 见 过 许多 函数 了 。 现 在 ， 让 我 们 多 花 一 点 时 间 来 彻底 地 讨论 函数 特性 。 本 章 的 运行 
示例 是 一 个 网 络 蜂 蛛 ， 也 就 是 web 搜索 引擎 中 负责 抓 取 网 页 部 分 的 组 件 ， 它 们 根据 抓 取 网 页 中 
的 链接 继续 抓 取 链接 指向 的 页 面 。 一 个 网 络 晓 蛛 的 例子 给 我 们 足够 的 机 会 去 探索 递归 函数 、 
BZ BR RAA BREE HIS AF o 


>” $L =e 
SESA 
函数 声明 包括 函数 名 、 形 式 参数 列表 、 返 回 值 列表 (TAB) 以 及 函数 体 。 


func name(parameter-list) (result-list) { 
body 
} 


形式 参数 列表 描述 了 函数 的 参数 名 以 及 参数 类 型 。 这 些 参 a ， 其 值 由 参数 调用 


者 提供 。 返 回 值 列 表 描 述 了 函数 返回 值 的 变量 名 以 及 类 型 。 如 果 函 数 返回 一 个 无 名 变量 或 者 
没有 返回 值 ， 返回 值 ARMS RT AH 略 的 。 a 个 函数 声明 不 包括 返回 值 列表 ， 那 么 
函数 体 执行 完毕 后 ， 不 会 返回 任何 值 。 在 hypot 部 数 中 ， 


func hypot(x, y float64) float64 { 
return math.Sqrt(x*x + y*y) 


} 
fmt.Println(hypot(3,4)) // "5" 


X 和 y 有 是 形 参 名 ,3 和 4 是 调用 时 的 传 入 的 实数 ， 函 数 返 回 了 一 个 float64 类 型 的 值 。 返回 值 也 可 以 
像 形式 参数 一 样 被 命名 。 在 这 种 情况 下 ， 每 个 返回 值 被 声明 成 一 个 局 部 变量 ， 并 根据 该 返回 
值 的 类 型 ， 将 其 初始 化 为 0。 如 果 一 个 函数 在 声明 时 ， 包 含 返回 值 列 表 ， 该 函数 必须 以 return 
语 名 结尾， 除非 函数 明显 无 法 运行 到 结尾 处 。 例 如 部 数 在 结尾 时 调用 了 panic 异 常 或 函数 中 存 
在 无 限 循 环 。 


正如 hypot 一 样 ， 如 果 一 组 形 参 或 返回 值 有 相同 的 类 型 ， 我 们 不 必 为 每 个 形 参 都 写 出 参数 类 
型 。 下 面 2 个 声明 是 等 价 的 : 


func f(i, J, k int, S, t string) Sede ory Hee ae 
func f(i int, j int, k int, s string, t string) { /* ... */ } 


下 面 ， 我 们 给 出 4 种 方法 声明 拥有 2 个 int 型 参数 和 1 个 int 型 返回 值 的 函数 .blank identifier( 译 者 
注 : 即 下 文 的 _ 符 号) 可 以 强调 某 个 参数 未 被 使 用 。 


func add(x int, y int) int {return x + y} 

func sub(x, y int) (z int) { z=x - y; return} 
func first(x int, _ int) int { return x } 

func zero(int, int) int { return © } 


fmt.Printf("%T\n", add) ie RNE nn 
fmt.Printf("%T\n", sub) fie ACNE E AAE E 
fmt.Printf("%T\n", first) // "func(int, int) int" 
fmt.Printf("%T\n", zero) // "func(int, int) int" 


一 对 应 ， 那 么 这 两 个 函数 被 认为 有 相同 的 类 型 和 标识 符 。 形 参 和 返回 值 的 变 
标识 符 也 不 影响 它们 是 否 可 以 以 省 略 参 数 类 型 的 形式 表示 。 


函数 的 类 型 被 称 为 函数 的 标识 符 。 如 果 两 个 函数 形式 参数 列表 和 返回 值 列 表 中 的 变量 类 型 一 


每 一 次 函数 调用 都 必须 按照 声明 顺序 为 dees HEEB (ARAE) 。 在 函数 调用 时 ，Go 语 
言 没 有 默认 参数 值 ， 也 没有 任何 方法 可 以 通 过 参数 名 指定 oe 因此 形 参 和 返回 值 的 变量 名 
对 于 函数 调用 者 而 言 没 有 意义 。 


在 元 数 体 中 ， 郊 数 的 形 参 作为 局 部 变量 ， 被 初始 化 为 调用 者 提供 的 值 。 函 数 的 形 参 和 有 名 返 
回 值 作 为 函数 最 外 层 的 局 部 变量 ， 被 存储 在 相同 的 词法 块 中 。 


参 通过 值 的 方式 传递 ， 因 此 函数 的 形 参 是 实 参 的 捞 贝 。 对 形 参 进行 修改 不 会 影响 实 参 。 但 
如 果实 参 包 括 引 用 类 型 ， 如 指针 ，slice( 切 片 )、map、function、channel 等 类 型 ， 实 参 可 
会 由 于 函数 的 简介 引用 被 修改 。 


ae fa A 


你 可 能 会 偶尔 遇 到 没有 函数 体 的 函数 声明 ， 这 表示 该 函数 不 是 以 Go 实现 的 。 这 样 的 声明 定义 
函数 标识 符 。 


package math 


func Sin(x float64) float //implemented in assembly language 


5.2. ğ 2 


函数 可 以 是 递归 的 ， 这 意味 着 函数 可 以 直接 或 间接 的 调用 自身 。 对 许多 问题 而 言 ， 递 归 是 一 
种 强 有 力 的 技术 ， 例 如 处 理 递归 的 数据 结构 。 在 4.4 节 ， 我 们 通过 遍历 二 又 树 来 实现 简单 的 插 
入 排序 ， 在 本 章节 ， 我 们 再 次 使 用 它 来 处 理 HTML 文 件 。 


下 文 的 示例 代码 使 用 了 非 标准 包 golang.org/x/net/html ， 解 析 HTML ° golang.org/x/... 目录 下 
存储 了 一 些 由 Go 团队 设计 、 维 护 ， 对 网 络 编程 、 国 际 化 文件 处 理 、 移 动 平台 、 图 像 处 理 、 加 
密 解密 、 开 发 者 工具 提供 支持 的 扩展 包 。 未 将 这 些 扩展 包 加 入 到 标准 库 原因 有 二 ， 一 是 部 分 
包 仍 在 开发 中 ， 二 是 对 大 多 数 Go 语 言 的 开发 者 而 言 ， 扩 展 包 提供 的 功能 很 少 被 使 用 。 


例子 中 调用 golang.org/x/net/html 的 部 分 api 如 下 所 示 。html.Parse 元 数 读 入 一 组 bytes. 解 析 

后 ， 返 回 html.node 类 型 的 HTML 页 面 树 状 结构 根 节点 。HTML 拥 有 很 多 类 型 的 结 点 如 text (X 
A) ,commnets (注释 ) 类 型 ， 在 下 面 的 例子 中 ， 我 们 只 关注 < name key='Value' > 形式 的 结 
点 。 


golang.org/x/net/html 


package html 


type Node struct { 


Type NodeType 
Data string 
Attr []Attribute 


FirstChild, NextSibling *Node 
} 


type NodeType int32 


const ( 
ErrorNode NodeType = iota 
TextNode 
DocumentNode 
ElementNode 
CommentNode 
DoctypeNode 


) 


type Attribute struct { 
Key, Val string 


} 


func Parse(r io.Reader) (*Node, error) 


main 元 数 解 析 HTML 标 准 输 入 ， 通 过 递归 函数 visit 获 得 links (链接 ) ， 并 打印 出 这 些 links : 


</i>gopl.io/ch5/findlinks1</i> 


// Findlinks1 prints the links in an HTML document read from standard input. 
package main 


import ( 
emt 


"os" 


"golang.org/x/net/htm1" 


) 
func main() { 
doc, err := html.Parse(os.Stdin) 
if err != nil { 
fmt.Fprintf(os.Stderr, "findlinks1: %v\n", err) 
os.Exit(1) 
} 
for _, link := range visit(nil, doc) { 


fmt.Println(link) 


visit 函 数 遍 历 HTML 的 节点 树 ， 从 每 一 个 anchor 元 素 的 href 属 性 获得 link, 将 这 些 links 存 入 字符 
串 数 组 中 ， 并 返回 这 个 字符 串 数 组 。 


// visit appends to links each link found in n and returns the result. 
func visit(links []string, n *html.Node) []string { 
if n.Type == html.ElementNode && n.Data == "a" { 
forns oan = range nm ACCE 
if a.Key == "href" { 
links = append(links, a.Val) 


} 
for c := n.FirstChild; c != nil; c = c.NextSibling { 
links = visit(links, c) 


} 


return links 


为 了 遍历 结 点 n 的 所 有 后 代 结 点 ， 每 次 遇 到 hn 的 孩子 结 点 时 ，visit 递 归 的 调用 自身 。 这 些 孩子 结 
点 存放 在 FirstChild 链 表 中 。 


让 我 们 以 Go 的 主页 (golang.org) 作为 目标 ， 运 行 findlinks。 我 们 以 fetch (1.5 章 ) 的 输出 作 
为 findlinks 的 输入 。 下 面 的 输出 做 了 简化 处 理 。 


$ go build gopl.io/chi/fetch 

$ go build gopl.io/ch5/findlinks1 

$ ./fetch https://golang.org | ./findlinks1i 
# 

/doc/ 

/pkg/ 

/help/ 

/blog/ 

http://play.golang.org/ 

//tour.golang.org/ 

https://golang.org/d1/ 

//blog.golang.org/ 

/ LICENSE 

/doc/tos. html 

http://www. google.com/intl/en/policies/privacy/ 


注意 在 页 面 中 出 现 的 链接 格式 ， 在 之 后 我 们 会 介绍 如 何 将 这 些 链接 ， 根 据 根 路 径 ( 
https://golang.org ) 生成 可 以 直接 访问 的 url。 


在 函数 outline 中 ， 我 们 通过 递归 的 方式 遍历 整个 HTML 结 点 树 ， 并 输出 树 的 结构 。 在 outline 内 
部 ， 每 遇 到 一 个 HTML 元 素 标 签 ， 就 将 其 入 栈 ， 并 输出 。 


gopl.io/ch5/outline 


func main() { 


doc, err := html.Parse(os.Stdin) 

if err != nil { 
fmt.Fprintf(os.Stderr, "outline: %v\n", err) 
os.Exit(1) 

} 


outline(nil, doc) 


} 


func outline(stack []string, n *html.Node) { 
if n.Type == html.ElementNode { 
stack = append(stack, n.Data) // push tag 
fmt.Println(stack) 


} 
for c := n.FirstChild; c != nil; c = c.NextSibling { 
outline(stack, c) 


有 一 点 值得 注意 : outline 有 入 栈 操作 ， 但 没有 相对 应 的 出 栈 操作 。 当 outline 调 用 自身 时 ， 被 调 
用 者 接收 的 是 stack 的 拷贝 。 被 调用 者 的 入 栈 操作 ， 修 改 的 是 stack 的 拷贝 ， 而 不 是 调用 者 的 
stack, 因 对 当 函 数 返 回 时 ,调用 者 的 stack 并 未 被 修改 。 


下 面 是 https://golang.org 页 面 的 简要 结构 : 


$ go build gopl.io/ch5/outline 
$ ./fetch https://golang.org | ./outline 
[html1] 

[html head] 

[html head meta] 

[html head title] 

[html head link] 

[html body] 

[html body div] 

[html body div] 

[html body div div] 

[html body div div form] 

[html body div div form div] 
[html body div div form div a] 


正如 你 在 上 面 实验 中 所 见 ， 大 部 分 HTML 页 面 只 需 几 层 递 归 就 能 被 处 理 ， 但 仍然 有 些 页 面 需要 
深层 次 的 递归 。 


大 部 分 编程 语言 使 用 固定 大 小 的 函数 调用 栈 ， 常 见 的 大 小 从 64KB 到 2MB 不 等 。 固 定 大 小 栈 会 
限制 递归 的 深度 ， 当 你 用 递归 处 理 大 量 数据 时 ， 需 要 避免 栈 溢出 ; 除 此 之 外 ， 还 会 导致 安全 
性 问题 。 与 相反 ,Go 语言 使 用 可 变 栈 ， 栈 的 大 小 按 需 增加 (初始 时 很 小 ) 。 这 使 得 我 们 使 用 递归 
时 不 必 考虑 溢出 和 安全 问题 。 


练习 5.1 : 修改 findlinks 代 码 中 遍历 n.FirstChild 链 表 的 部 分 ， 将 循环 调用 visit， 改 成 递归 调 
用 。 


练习 5.2: 编写 函数 ， 记 录 在 HTML 树 中 出 现 的 同名 元 素 的 次 数 。 


练习 5.3 : 编写 函数 输出 所 有 text 结 点 的 内 容 。 注 意 不 要 访问 <script> 和 <style> 元 素 ,因为 
这 些 元 素 对 浏览 者 是 不 可 见 的 。 


练习 5.4 : 扩展 vist 函 数 ， 使 其 能 够 处 理 其 他 类 型 的 结 点 ， 如 images、scripts 和 style sheets ° 


5.3. 多 返回 值 


在 Go 中 ， 一 个 函数 可 以 返回 多 个 值 。 我 们 已 经 在 之 前 例子 中 看 到 ， 许 多 标准 库 中 的 函数 返回 2 
个 值 ， “ARAE 得 到 的 返回 值 ， 另 一 个 是 函数 出 错时 的 错误 信息 。 下 面 的 例子 会 展示 如 何 
编写 多 返回 值 的 函数 。 


下 面 的 程序 是 findlinks 的 改进 版 本 。 修 改 后 的 findlinks 可 以 自己 发 起 HTTP 请 求 ， 这 样 我 们 就 不 
必 再 运行 fetch。 因 为 HTTP 请 求 和 解析 操作 可 能 会 失败 ， 因 此 findlinks 声 明了 2 个 返回 值 : 链 
接 列表 和 错误 信息 。 一 般 而 言 ， ed 可 以 处 理 HTML 页 面 的 错误 结 点 ， 构 造 出 
HTML 页面 结构 ， 所 以 解析 HTML 很 少 失败 。 这 意味 着 如 果 findlinks 函 数 失 败 了 ， 很 可 能 是 由 
于 I/O 的 错误 导致 的 。 


gopl.io/ch5/findlinks2 


func main() { 
for _, url := range os.Args[1i:] { 
links, err := findLinks(url) 
if err != nil { 
fmt.Fprintf(os.Stderr, "findlinks2: %v\n", err) 


continue 

} 

for _, link := range links { 
fmt.Println(link) 

} 


// findLinks performs an HTTP GET request for url, parses the 
// response as HTML, and extracts and returns the links 
func findLinks(url string) ([]string, error) { 
resp, err := http.Get(url) 
if err != nil { 
return nil, err 
} 
if resp.StatusCode != http.StatusOK { 
resp.Body.Close() 
return nil, fmt.Errorf("getting %s: %s", url, resp.Status) 
} 
doc, err := html.Parse(resp.Body) 
resp.Body.Close() 
if err != nil { 
return nil, fmt.Errorf("parsing %s as HTML: %v", url, err) 


} 


return visit(nil, doc), nil 


在 findlinks 中 ， 有 4 处 return 语 名 ， 每 一 处 return 都 返回 了 一 组 值 。 前 三 处 return ， oe 

包 中 的 错误 信息 传递 给 findlinks 的 调用 者 。 第 一 处 return 直 接 返 回 错误 信息 ， 其 他 两 处 通 
fmt.Errorf (7. ° 输出 详细 的 错误 信息 。 如 果 findlinks 成 功 结束 ， 最 后 的 return 语 ok 
析 获 得 的 连接 返回 给 用 户 。 


在 finallinks 中 ， 我 们 必须 确保 resp.Body 被 关闭 ， 释 放 网 络 资源 。 虽 然 Go 的 垃圾 回收 机 制 会 回 
收 不 被 使 用 的 内 存 ， 但 是 这 不 包括 操作 系统 层面 的 资源 ， 比 如 打开 的 文件 、 网 络 连 接 。 因 此 
我 们 必须 显 式 的 释放 这 些 资源 。 


调用 多 返回 值 吕 数 时 ， 返 回 给 调用 者 的 是 一 组 值 ， 调 用 者 必须 显 式 的 将 这 些 值 分 配给 变量 : 


links, err := findLinks(ur1l) 


如 果 某 个 值 不 被 使 用 ， 可 以 将 其 分 配给 blank identifier: 


links, _ := findLinks(url) // errors ignored 


一 个 函数 内 部 可 以 将 另 一 个 有 多 返回 值 的 函数 作为 返回 值 ， 下 面 的 例子 展示 了 与 findLinks 有 
相同 功能 的 函数 ， 两 者 的 区 别 在 于 下 面 的 例子 先 输出 参数 : 


func findLinksLog(url string) ([]string, error) { 
log.Printf("findLinks %s", url) 
return findLinks(url) 


当 你 调用 接受 多 参数 的 函数 时 ， 可 以 将 一 个 返回 多 参数 的 函数 作为 该 函数 的 和 参数。 虽然 这 很 
少 出 现在 实际 生产 代码 中 ， 但 这 个 特性 在 debug 时 很 方便 ， 我 们 只 需要 一 条 语句 就 可 以 输出 所 
有 的 返回 值 。 下 面 的 代码 是 等 价 的 : 


log.Print1ln(findLinks(ur1) ) 
links, err := findLinks(url) 
log.Printlin(links, err) 


准确 的 变量 名 可 以 传达 函数 返回 值 的 含义 。 尤 其 在 返回 值 的 类 型 都 相同 时 ， 就 像 下 面 这 样 : 


func Size(rect image.Rectangle) (width, height int) 
func Split(path string) (dir, file string) 
func HourMinSec(t time.Time) (hour, minute, second int) 


虽然 良好 的 命名 很 重要 ， 但 你 也 不 必 为 每 一 个 返回 值 都 取 一 个 适 ARAT ee de HB IR 
例 ， 了 有 函数 的 最 后 一 个 bool 类 型 a ，error 类 型 的 返回 值 代表 函 数 
的 错误 信息 ， 对 于 这 些 类 似 的 惯例 ， 我 们 不 必 思 考 合 适 的 命名 ， 它 们 都 无 需 解释 。 


如 果 一 个 函数 将 所 有 的 返回 值 都 显示 的 变量 名 ， 那 么 该 函数 的 return 语 句 可 以 省 略 操 作 数 。 这 
称 之 为 bare return ° 


// CountwordsAndImages does an HTTP GET request for the HTML 
// document url and returns the number of words and images in it. 
func CountWordsAndImages(url string) (words, images int, err error) { 
resp, err := http.Get(url) 
if err != nil { 
return 
} 
doc, err := html.Parse(resp.Body) 
resp.Body.Close() 
if err != nil { 
err = fmt.Errorf("parsing HTML: %s", err) 


return 
} 
words, images = countWordsAndImages(doc) 
return 
} 
func countWordsAndImages(n *html.Node) (words, images int) { /* ... */ } 


按照 返回 值 列表 的 次 序 ， 返 回 所 有 的 返回 值 在 上 面 的 例子 中 ， 每 一 个 return 语 句 等 价 于 : 


return words, images, err 


当 一 个 亟 数 有 多 处 return 语 句 以 及 许多 返回 值 时 ，bare return 可 以 减少 代码 的 重复 ， 但 是 使 得 
代码 难以 被 理解 。 举 个 例子 ， 如 果 你 没有 仔细 的 审查 代码 ， 很 难 发 现 前 2 处 return 等 价 于 
return 0,0,err (Go 会 将 返回 值 Words 和 images 在 函数 体 的 开始 处 ， 根 据 它们 的 类 型 ， 将 其 初 
始 化 为 0) ， 最 后 一 处 return 等 价 于 return words > image nil。 基 于 以 上 原因 ， 不 宜 过 度 使 用 
bare return ° 


练习 5.5: 实现 CountVWordsAndlImages。 (参考 练习 4.9 如 何 分 词 ) 


练习 5.6 : 修改 gopl.io/ch3/surface (§3.2) 中 的 corner 有 函数 ， 将 返回 值 命名 ， 并 使 用 bare 
return。 


5.4. 错误 


GOP ABBY BAK AER BAF © Hetmstrings.Contains#*strconv.FormatBool & žk > 
对 各 种 可 能 的 输入 都 做 了 良好 的 处 理 ， 使 得 运行 时 几乎 不 会 失败 ， 除 非 遇 到 灾难 性 的 、 不 可 
预料 的 情况 ， 比 如 运行 时 的 内 存 溢 出 。 导 致 这 种 错误 的 原因 很 复杂 ， 难 以 处 理 ， 从 错误 中 恢 
复 的 可 能 性 也 很 低 。 


还 有 一 部 分 函数 只 要 输入 的 参数 满足 一 定 条 件 ， 也 能 保证 运行 成 功 。 比 如 time.Date 有 函数 ， 该 

函数 将 年 月 日 等 参数 构造 成 time.Time 对 象 ， 除 非 最 后 一 个 参数 (NEA) 是 nil。 这 种 情况 下 会 

ey panic 是 来 自 被 调 函 数 的 信号 ， 表 示 发 生 了 某 个 已 知 的 bug。 一 个 良好 的 程序 
远 不 应 该 发 生 panic 异 常 。 


对 于 大 部 分 函数 而 言 ， 永 远 无 法 确保 能 否 成 功 运行 。 这 是 因为 错误 的 原因 超出 了 程序 员 的 控 
制 。 举 个 例子 ， 任 何 进 行 JO 操 作 的 enn 出 现 错误 的 可 能 ， 只 有 没有 经 验 的 程序 员 才 
会 相信 读 写 操作 不 会 失败 ， 即 时 是 简单 的 读 写 。 因 此 ， 当 本 该 可 信 的 操作 出 乎 意料 的 失败 
后 ， 我 们 必须 弄 清 楚 导 致 失败 的 原因 。 


在 Go 的 错误 处 理 中 ， 错 误 是 软件 包 API 和 应 用 程序 用 户 界 面 的 一 个 重要 组 成 部 分 ， 程 序 运 行 
失败 仅 被 认为 是 几 个 预期 的 结果 之 一 。 


对 于 那些 将 运行 失败 看 作 是 预期 结果 的 函数 ， 它 们 会 返 a 

个 ， 来 传递 错误 信息 。 如 果 导 致 失败 的 原因 只 有 一 个 ， 额 外 的 返回 值 可 以 是 一 个 布尔 值 ， 

常 被 命名 为 ok。 比 如 ，cache.Lookup 失 败 的 唯一 原因 是 key 不 存在 ， 那 么 代码 可 以 按 ! 
方式 组 织 : 


value, ok := cache.Lookup(key) 
if !ok { 

// ...cache[key] does not exist... 
} 


通常 ， 寻 致 失败 的 原因 不 止 一 种 ， 尤 其 是 对 MO 操作 而 言 ， 用 户 需要 了 解 更 多 的 错误 信息 。 
此 ， 额 外 的 返回 值 不 再 是 简单 的 布尔 类 型 ， 而 是 error 类 型 。 


内 置 的 error 是 接口 类 型 。 我 们 将 在 第 七 章 了 解 接口 类 型 的 含义 ， 以 及 它 对 错误 处 理 的 影响 。 
现在 我 们 只 需要 明白 error 类 型 可 能 是 nil 或 者 non-nil。nil 意 味 着 函数 运行 成 功 ，nonc-nil 表 示 失 
败 。 oo nila) error Æ RAT ARÁ t A error) Error Sak A AT HE BRR SH SRA 
的 错误 信 


fmt.Println(err) 
fmt.Printf("%v", err) 


i > 3 AAR Elnon-nil4errorkl > Hay 2k 4a Æ A SL hy (undefined), È 2 R E VNR 
值 应 该 被 忽略 。 然 而 ， 有 少 部 分 函数 在 发 生 错 误 时 ， 仍 然 会 返回 一 些 有 用 的 返回 值 。 比 如 ， 

当 读 取 文 件 发 生 错误 时 ，Read 函 数 会 返回 可 以 读 取 的 字 节 数 以 及 错误 信息 。 对 于 这 种 情况 ， 
正确 的 处 理 方式 应 该 是 先 处 理 这 些 不 完整 的 数据 ， 再 处 理 错误 。 因 此 对 函数 的 返回 值 要 有 清 

晰 的 说 明 ， 以 便于 其 他 人 使 用 。 


在 Go 中 ， 遂 数 运行 失败 时 会 返回 错误 信息 ， 这 些 错误 信息 被 认为 是 一 种 预期 的 值 而 非 异 常 
(exception) ， 这 使 得 Go 有 别 于 那些 将 函数 运行 失败 看 作 是 异常 的 语言 。 虽 然 Go 有 各 种 异 
常 机 制 ， 但 这 些 机 制 仅 被 使 用 在 处 理 那 些 未 被 预料 到 的 错误 ， 即 bug， 而 不 是 那些 在 健壮 程序 
中 应 该 被 避免 的 程序 错误 。 对 于 Go 的 异常 机 制 我 们 将 在 5.9 介 绍 。 


AU STAT Tae EAE AGAIN ee 
形式 抛 出 会 混乱 对 错误 的 描述 ， 这 通常 会 导致 一 些 糟糕 的 后 果 。 当 某 个 程序 错误 被 当 作 异常 
处 理 后 ， 这 个 错误 会 将 堆栈 根据 信息 返回 给 终端 用 户 ， 这 些 信息 复杂 且 无 用 ， 无 法 帮助 定位 


错误 。 


正 因 此 ，Go 使 用 控制 流 机 制 (如 if 和 return) 处 理 异 常 ， 这 使 得 编码 人 员 能 更 多 的 关注 错误 处 
FH o 


5.4.1. 错误 处 理 策 略 


当 一 次 函数 调用 返回 错误 时 ， 调 用 者 有 应 该 选择 何 时 的 方式 处 理 错 误 。 根 据 情 况 的 不 同 ， 有 
很 多 处 理 方式 ， 让 我 们 来 看 看 常用 的 五 种 方式 。 


首先 ， 也 是 最 常用 的 方式 是 传播 错误 。 这 意味 着 函数 中 某 个 子 程序 的 失败 ， 会 变 成 该 函数 的 
失败 。 下 面 ， 我 们 以 5.3 节 的 findLinks 有 函数 作为 例子 。 如 果 findLinks 对 http.Get 的 调用 失败 ， 
findLinks 会 直接 将 这 个 HTTP 错 误 返 回 给 调用 者 : 


resp, err := http.Get(url) 
if err != nil{ 
return nill, err 


} 


当 对 html.Parse 的 调用 失败 时 ，findLinks 不 会 直接 返回 html.Parse 的 错误 ， 因 为 缺少 两 条 重要 
ee 这 些 信 息 有 助 于 错误 的 处 理 ，findLinks 会 
构造 新 的 错误 信息 返回 给 调用 者 : 


doc, err := html.Parse(resp.Body) 
resp.Body.Close() 
if err != nil { 
return nil, fmt.Errorf("parsing %s as HTML: %v", url,err) 


} 


fmt.Errorf 骂 数 使 用 fmt.Sprintf 格 式 化 错误 信息 并 返回 。 我 们 使 用 该 函数 前 级 添加 额外 的 上 下 文 
信息 ory \ 到 原始 错 误 信 息 Ww o ț 错 TA RA h main $ žk ah IE a} 3 错 误 信 息 应 提供 ZN vA 青 晰 的 从 原 因 到 后 E] 果 
的 因果 链 ， 就 像 美国 宇航 局 事故 调查 时 做 的 那样 : 


genesis: crashed: no parachute: G-switch failed: bad relay orientation 


由 于 错误 信 aes A ， 所 以 错误 信息 中 应 避免 大 写 和 换行 符 。 最 终 的 错 
误 信 息 可 能 很 长 ， 我 们 可 以 通过 类 似 grep 的 工具 处 理 错 误 信 息 ( 译 者 注 : grep 是 一 种 文本 搜 
索 工 具 ) 。 


编写 错误 信息 时 ， 我 们 要 确保 错误 信息 对 问题 细节 的 描述 是 详尽 的 。 尤 其 是 要 注意 错误 信息 
表达 的 一 致 性 ， 即 相同 的 函数 或 同 包 内 的 同一 组 函数 返回 的 错误 在 构成 和 处 理 方式 上 是 相似 
的 。 


以 OS 和 包 为 例 ，OS 包 确保 文件 操作 (如 0s.Open、Read、Write、Close) 返回 的 每 个 错误 的 描 
述 不 仅仅 包含 错误 的 原因 (如 无 权限 ， 文 件 目 录 不 存在 ) 也 包含 文件 名 ， 这 样 调用 者 在 构造 
新 的 错误 人 言 息 时 无 需 再 添加 这 些 信息。 


一 般 而 言 ， 被 调 函 数 f(X) 会 将 调用 信息 和 参数 信息 作为 发 生 错误 时 的 上 下 文 放 在 错误 信息 中 并 
到 回 给 调用 者 ， 调 用 者 需要 添加 一 些 错误 信息 中 不 包含 的 信息 ， 比 如 添加 url 到 html.Parse 返 回 
的 错误 中 。 


让 我 们 来 看 看 处 理 错误 的 第 二 种 策略 。 如 果 错 误 的 发 生 是 偶然 性 的 ， 或 由 不 可 预知 的 问题 导 
致 的 。 一 个 明智 的 选择 是 重新 尝试 失败 的 操作 。 在 重 试 时 ， 我 们 需要 限制 重 试 的 时 间 间 隔 或 
重 试 的 次 数 ， 防 止 无 限制 的 重 试 。 


gopl.io/ch5/wait 


// WaitForServer attempts to contact the server of a URL. 
// It tries for one minute using exponential back-off. 
// It reports an error if all attempts fail. 
func WaitForServer(url string) error { 
const timeout = 1 * time.Minute 
deadline := time.Now().Add( timeout) 


for tries := 0; time.Now().Before(deadline); tries++ { 
_, err := http.Head(url) 
if err == nil { 


return nil // success 
} 
log.Printf("server not responding (%s);retrying...", err) 
time.Sleep(time.Second << uint(tries)) // exponential back-off 


} 


return fmt.Errorf("server %s failed to respond after %s", url, timeout) 


如 果 错 误 发 生 后 ， 程 序 无 法 继续 运行 ， 我 们 就 可 以 采用 第 三 种 策略 : 输出 错误 信息 并 结束 程 
序 。 需 要 注意 的 是 ， 这 种 策略 只 应 在 main 中 执行 。 对 库 函 数 而 言 ， 应 仅 向 上 传播 错误 ， 除 非 
该 错误 意味 着 程序 内 部 包含 不 一 致 性 ， 即 遇 到 了 bug， 才 能 在 库 函 数 中 结束 程序 。 


// (In function main. ) 

if err := WaitForServer(url); err != nil { 
fmt.Fprintf(os.Stderr, "Site is down: %v\n", err) 
os.Exit(1) 


调用 log.Fatalf 可 以 更 简洁 的 代码 达到 与 上 文 相 同 的 效果 。log 中 的 所 有 函数 ， 都 默认 会 在 错误 
信息 之 前 输出 时 间 信息 。 


if err := WaitForServer(url); err != nil { 
log.Fatalf("Site is down: %v\n", err) 


长 时 间 运 行 的 服务 器 常 采 用 默认 的 时 间 格 式 ， 而 交互 式 工具 很 少 采 用 和 包含 如 此 多 信息 的 格 
式 。 


2006/01/02 15:04:05 Site is down: no such domain: 
bad.gopl.io 


我 们 可 以 设置 log 的 前 组 信息 屏蔽 时 间 人 信息， 一 般 而 言 ， 前 缓 信息 会 被 设置 成 命令 名 。 


log.SetPrefix("wait: ") 
log.SetFlags(0) 


第 四 种 策略 : 有 时 ， 我 们 只 需要 输出 错误 信息 就 足够 了 ， 不 需要 中 断 程 序 的 运行 。 我 们 可 以 
通过 |og 包 提供 函数 


if err := Ping(); err != nil { 
log.Printf("ping failed: %v; networking disabled",err) 


或 者 标准 错误 流 输 出 错误 信息 。 


if err := Ping(); err != nil { 
fmt.Fprintf(os.Stderr, "ping failed: %v; networking disabled\n", err) 


log 包 中 的 所 有 骂 数 会 为 没有 换行 符 的 字符 串 增 加 换行 符 。 


第 五 种 ， 也 是 最 后 一 种 策略 : 我 们 可 以 直接 忽略 掉 错 误 。 


dir, err := ioutil.TempDir("", "scratch") 
if err != nil { 
return fmt.Errorf("failed to create temp dir: %v",err) 
} 
// ...use temp dir... 


os.RemoveAll(dir) // ignore errors; $TMPDIR is cleaned periodically 


尽管 os.RemoveAll 会 失败 ， 但 上 面 的 例子 并 没有 做 错误 处 理 。 这 是 因为 操作 系统 会 定期 的 清 
理 临 时 目录 。 正 因 如 此 ， 虽 然 程序 没有 处 理 错误 ， 但 程序 的 逻辑 不 会 因此 受到 影响 。 我 们 应 
该 在 每 次 函数 调用 后 a? 都 养 成 考虑 错误 处 理 的 习惯 9 当 你 决定 忽略 某 个 i 错误 时 š 你 应 该 在 清 
晰 的 记录 下 你 的 意图 。 


在 Go 中 ， 错 误 处 理 有 一 套 独特 的 编码 风格 。 检 查 某 个 子 函 数 是 否 失败 后 ， 我 们 通常 将 处 理 失 
败 的 逻辑 代码 放 在 处 理 成 功 的 代码 之 前 。 如 果菜 个 错误 会 导致 函数 返回 ， 那 么 成 功 时 的 逻辑 
代码 不 应 放 在 else 语 句 块 中 ， 而 应 直接 放 在 函数 体 中 。Go 中 大 部 分 函数 的 代码 结构 几乎 相 

同 ， 首 先是 一 系列 的 初始 检查 ， 防 止 错误 发 生 ， 之 后 是 函数 的 实际 逻辑 。 


5.4.2. 文件 结尾 错误 (EOF ) 


函数 经 常会 返回 多 种 错误 ， 这 对 终端 用 户 来 说 可 能 会 很 有 趣 ， 但 对 程序 而 言 ， 这 使 得 情况 变 

得 复杂 。 很 多 时 候 ， 程 序 必 须根 据 错误 类 型 ， 作 出 不 同 的 响应 。 让 我 们 考虑 这 样 一 个 例子 : 

从 文件 中 读 取 n 个 字 节 。 如 果 n 等 于 文件 的 长 度 ， 读 取 过 e 
文件 的 长 度 ， 调 用 者 会 重复 的 读 取 固 定 大 小 的 数据 直到 文件 结束 。 这 会 导致 调用 者 必须 分 

处 理由 文件 结 e 
都 返回 同一 个 错误 io.EOF， 该 错误 在 io 包 中 定义 : 





package io 
import "errors" 


// EOF is the error returned by Read when no more input is available. 
var EOF = errors.New("E0OF") 


调用 者 只 需 通过 简单 的 比较 ， 就 可 以 检测 出 这 个 错误 。 下 面 的 例子 展示 了 如 何 从 标准 输入 中 
读 取 字符 ， 以 及 判断 文件 结束 。 (4.3 的 chartcount 程 序 展示 了 更 加 复杂 的 代码 ) 


in := bufio.NewReader(os.Stdin) 
for { 
r, _, err := in.ReadRune() 
if err == i0.E0OF { 
break // finished reading 
} 
if err != nil { 
return fmt.Errorf("read failed:%v", err) 
J eS Con leer 
} 


因为 文件 结束 这 种 错误 不 需要 更 多 的 描述 ， 所 以 io0.EOF 有 固定 的 错误 信息 一 “EOF”。 对 于 其 
他 错误 ， 我 们 可 能 需要 在 错误 信息 中 描述 错误 的 类 型 和 数量 ， 这 使 得 我 们 不 能 像 io.EOF 一 样 
采用 国定 的 错误 信息 。 在 7.11 节 中 ， 我 们 会 提出 更 系统 的 方法 区 分 某 些 国定 的 错误 值 。 


PB AX AB 


在 Go 中 ， 函 数 被 看 作 第 一 类 值 (first-class values) : 函数 像 其 他 值 一 样 ， 拥 有 类 型 ， 可 以 被 
赋值 给 其 他 变量 ， 传 递 给 函数 ， 从 有 函数 返回 。 对 函数 值 (function value) 的 调用 类 似 函 数 调 
用 。 例 子 如 下 : 


func square(n int) int { return n * n} 


func negative(n int) int { return -n } 
func product(m, n int) int { return m * n } 


f := square 
fmt.Printin(f(3)) // "9" 


f = negative 
fmt .Println(f(3)) We Mesoyi 


fmt.Printf("%T\n", f) // "func(int) int" 


f = product // compile error: can't assign func(int, int) int to func(int) int 


HAXA AY RA zenil © HAA fA A nil HAHA 4] panics iK : 


var f func(int) int 
(3) // 此 处 f 的 值 为 nil， 会 引起 panic 错 误 


HRT VSI eae : 


var f func(int) int 
ain f l= nil {i 

F(3) 
} 


但 是 函数 值 之 间 是 不 可 比较 的 ， 也 不 能 用 函数 值 作 为 map 的 key 。 


函数 值 使 得 我 们 不 仅仅 可 以 通过 数据 来 参数 化 函数 ， 亦 可 通过 行为 。 标 准 库 中 包含 许多 这 样 
的 例子 。 下 面 的 代码 展示 了 如 何 使 用 这 个 技巧 。strings. na 串 中 的 每 个 字符 调用 add1 
函数 ， 并 将 每 个 add1 函 数 的 返回 值 组 成 一 个 新 的 字符 串 返 回 给 调用 者 。 


func addi(r rune) rune { return r + 1 } 
fmt.Println(strings.Map(addi, "HAL-9000")) // "IBM. :111" 


fmt.Println(strings.Map(addi, "VMS")) // "WNT" 
fmt.Println(strings.Map(addi, "Admix")) // “Benjy" 
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而 对 结 点 进行 不 同 的 操作 。 


gopl.io/ch5/outline2 


// forEachNode 针 对 每 个 结 点 x, 都 会 调用 pre(x) 和 post (x) 






// pre 和 post 者 








func forEachNode(n *html.Node, pre, post func(n *html.Node)) { 
if pre != nil { 
pre(n) 
} 
for c := n.FirstChild; c != nil; c = c.NextSibling { 
forEachNode(c, pre, post) 
} 
if post != nil { 
post(n) 


该 函数 接收 2 个 函数 作为 参数 ， 分 别 在 结 点 的 孩子 被 访问 前 和 访问 后 调用 。 这 样 的 设计 给 调用 
者 更 大 的 灵活 性 。 举 个 例子 ， Kis 我 们 有 startElemen 和 endElement 两 个 函数 用 于 输出 HTML 
元 素 的 开始 标签 和 结束 标签 <b>. . .</b> 


var depth int 
func startElement(n *html.Node) { 
if n.Type == html.ElementNode { 
fmt.Printf("%*s<%s>\n", depth*2, "", n.Data) 
depth++ 


} 
func endElement(n *html.Node) { 
if n.Type == html.ElementNode { 
depth-- 
fmt.Printf("%*s</%s>\n", depth*2, "", n.Data) 


上 面 的 代码 利用 fmt.Printf 的 一 个 小 技巧 控制 输出 的 缩 进 。 w*s 中 的 * 会 在 字符 串 之 前 填充 一 
些 空格 。 在 例子 中 ,每 次 输出 会 先 填充 depth*2 数量 的 空格 ， 再 输出 "， 最 后 再 输出 HTML 标 


o 


X 


如 果 我 们 像 下 面 这 样 调 用 forEachNode : 


forEachNode(doc, startElement, endElement) 


与 之 前 的 outline 程 序 相 比 ， 我 们 得 到 了 更 加 详细 的 页 面 结构 : 


$ go build gopl.io/ch5/outline2 
$ ./outline2 http://gopl.io 
<html> 
<head> 
<meta> 
</meta> 
<title> 
</title> 
<style> 
</style> 
</head> 
<body> 
<table> 
<tbody> 
<tr> 
<td> 
<a> 
<img> 
</img> 


练习 5.7: 完善 startElement 和 endElement 有 函数 ， 使 其 成 为 通用 的 HTML 输 出 器 。 要 求 : 输出 
注释 结 点 ， 文 本 结 点 以 及 每 个 元 素 的 属性 (< ahref='...'>) 。 使 用 简略 格式 输出 没有 孩子 结 点 
的 元 素 〈 即 用 <img/> 代替 <img></img> ) 。 编 写 测 试 ， 验 证 程序 输出 的 格式 正确 。 ( 详 见 11 


章 ) 


草 


练习 5.8 : 修改 pre 和 post 函 数 ， 使 其 返回 布尔 类 型 的 返回 值 。 返 回 false 时 ， 中 止 
forEachNoded 的 遍历 。 使 用 修改 后 的 代码 编写 ElementBylID 有 函数 ， 根 据 用 户 输入 的 id 查找 第 
一 个 拥有 该 jd 元 素 的 HTML 元 素 ， 查 找 成 功 后 ， 停 止 遍历 。 


func ElementByID(doc *html.Node, id string) *html.Node 


练习 5.9 : 编写 函数 expand， 将 s 中 的 "foo" 替 换 为 fl"foo") 的 返回 值 。 


func expand(s string, f func(string) string) string 


5.6. E% Ha 


拥有 函数 名 的 函数 只 能 在 包 级 语法 块 中 被 声明 ， 通 过 有 函数 字面 量 (function literal) ， 我 们 可 

绕 过 这 一 限制 ， 在 任何 表达 式 中 表示 一 个 函数 值 。 函 数字 面 量 的 语法 和 函数 声明 相似 ， 区 别 

在 于 func 关 键 字 后 没有 函数 名 。 遂 数值 字面 量 是 一 种 表达 式 ， 它 的 值 被 称 为 匿名 函数 
(anonymous function) 。 

函数 字面 量 允 许 我 们 在 使 用 函数 时 ， 再 定义 它 。 通 过 这 种 技巧 ， 我 们 可 以 改写 之 前 对 

strings.Map 的 调用 : 


strings.Map(func(r rune) rune { return r + 1 }, "HAL-9000") 
更 为 重要 的 是 ， 通 过 这 种 方式 定义 的 函数 可 以 访问 完整 的 词法 环境 (lexical environment) ， 
REALE BRP ELMAR BATA AG RRR GE > to PHAR : 
gopl.io/ch5/squares 


// squares% u — AE% HF 
// 该 匿名 函数 每 次 被 调用 时 都 会 返 
func squares() func() int { 





var x int 
return func() int { 
X++ 
returni x x 
} 
} 
func main() { 
f := squares() 
fmt.Println(f()) // " 
fmt.Printin(f()) // " 
fmt.Println(f()) // " 
fmt.Println(f()) // " 
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函数 squares 返 回 另 一 个 类 型 为 func() int 的 函数 。 对 squares 的 一 次 调用 会 生成 一 个 局 部 变量 
Xx 并 返回 一 个 匿名 函数 。 每 次 调用 时 匿名 函数 时 ， 该 函数 都 会 先 使 x 的 值 加 1， 再 返回 x 的 平 
方 。 第 二 次 调用 squares 时 ， 会 生成 第 二 个 x 变量 ， 并 返回 一 个 新 的 匿名 函数 。 新 匿名 函数 操 


作 的 是 第 二 个 x 变量 。 


squares 的 例子 证 明 ， 郊 数值 不 仅仅 是 一 串 人 代码， 还 记录 了 状态 。 在 squares 中 定义 的 匿名 内 
部 函数 可 以 访问 和 更 新 squares 中 的 局 部 变量 ， 这 意味 着 匿名 函数 和 squares 中 ， 存 在 变量 引 
用 。 这 就 是 函数 值 属 于 引用 类 型 和 函数 值 不 可 比较 的 原因 。Go 使 用 闭 包 (closures) 技术 实 
现 函 数值 ，Go 程 序 员 也 把 函数 值 叫 做 闭 包 。 


通过 这 个 例子 ， 我 们 看 到 变量 的 生命 周期 不 由 它 的 作用 域 决 定 : squares 返 回 后 ， 变 量 X 仍 然 
隐 式 的 存在 于 f 中 。 


接 下 来 ， 我 们 讨论 一 个 有 点 学 术 性 的 例子 ， 考 虑 这 样 一 个 问题 : 给 定 一 些 计 算 机 课程 ， 每 个 
课程 都 有 前 置 课程 ， 只 有 完成 了 前 置 课 程 才 可 以 开始 当前 课程 的 学 习 ; 我 们 的 目标 是 选择 出 
一 组 课程 ， 这 组 课程 必须 确保 按 顺序 学 习 时 ， 能 全 部 被 完成 。 每 个 课程 的 前 置 课 程 如 下 : 


gopl.io/ch5/toposort 


// prereqs 记 录 了 每 个 课程 的 前 置 课程 
var prereqs = map[string][]string{ 
"algorithms": {"data structures"}, 
"calculus": {"linear algebra"}, 
"compilers": { 
"data structures", 
"formal languages", 
"computer organization", 


}, 

udata stnuctuges.:: {"discrete math"}, 

"databases": {"data structures"}, 

"discrete mathi: {"intro to programming" }, 

"formal languages": {"discrete math"}, 

"networks": {"operating systems"}, 

"operating systems": {"data structures", "computer organization"}, 


"programming languages": {"data structures", "computer organization"}, 


这 类 问题 被 称 作 拓扑 排序 。 从 概念 上 说 ， 前 置 条 件 可 以 构成 有 向 图 。 图 中 的 顶点 表示 课程 ， 
边 表示 课程 间 的 依赖 关系 。 显 然 ， 图 中 应 该 无 环 ， 这 也 就 是 说 从 某 点 出 发 的 边 ， 最 终 不 会 回 
到 该 点 。 下 面 的 代码 用 深度 优先 搜索 了 整 张 图 ， 获 得 了 符合 要 求 的 课程 序列 。 


func main() { 
for i, course := range topoSort(prereqs) { 
fmt.Printf("%d:\t%s\n", i+1, course) 
} 
} 


func topoSort(m map[string][]string) []string { 
var order []string 
seen := make(map[string]bool) 
var visitAll func(items []string) 
visitAll = func(items []string) { 
for _, item := range items { 
if !seen[item] { 
seen[item] = true 
visitAll(m[item] ) 
order = append(order, item) 


} 
} 
var keys []string 
for key := range m { 
keys = append(keys, key) 
} 
sort.Strings(keys) 
visitAll(keys) 
return order 


当 匿 名 有 函数 需要 被 递归 调用 时 ， 我 们 必须 首先 声明 一 个 变量 (在 上 面 的 例子 中 ， 我 们 首先 声 
明了 visitAll) ， 再 将 匿名 兄 数 赋值 给 这 个 变量 。 如 果 不 分 成 两 部 ， 交 数字 面 量 无 法 与 visitAl 
绑 定 ， 我 们 也 无 法 递归 调用 该 匿名 函数 。 


visitAll := func(items []string) { 
Efe chert 
visitAll(m[item]) // compile error: undefined: visitAll 
He ose 


在 topsort 中 ， 首 先 对 prereqs 中 的 key 排 序 ， 再 调用 visitAll。 因 为 prereqs 映 射 的 是 切片 而 不 是 
更 复杂 的 map， 所 以 数据 的 遍历 次 序 是 国定 的 ， 这 意味 着 你 每 次 运行 topsort 得 到 的 输出 都 是 
一 样 的 。 topsort 的 输出 结果 如 下 : 


intro to programming 
discrete math 

data structures 
algorithms 

linear algebra 
calculus 

formal languages 
computer organization 
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让 我 们 回 到 findLinks 这 个 例子 。 我 们 将 代码 移动 到 了 links 包 下 ， 将 函数 重 命名 为 Extract， 在 
第 八 章 我 们 会 再 次 用 到 这 个 函数 。 新 的 匿名 函数 被 引入 ， 用 于 替换 原来 的 visit 函 数 。 该 匿名 函 
数 负责 将 新 连接 添加 到 切片 中 。 在 Extract 中 ， 使 用 forEachNode 遍 历 HTML 页 面 ， 由 于 Extract 
只 需要 在 遍历 结 点 前 操作 结 点 ， 所 以 forEachNode 的 post 参 数 被 传 入 nil 。 


gopl.io/chd/inks 


// Package links provides a link-extraction function. 
package links 
import ( 
MiMi 
"net/http" 
"golang.org/x/net/html" 
) 
// Extract makes an HTTP GET request to the specified URL, parses 
// the response as HTML, and returns the links in the HTML document. 
func Extract(url string) ([]string, error) { 
resp, err := http.Get(url) 
if err != nil { 
return nil, err 
} 
if resp.StatusCode != http.StatusOK { 
resp.Body.Close() 
return nil, fmt.Errorf("getting %s: %s", url, resp.Status) 


doc, err := html.Parse(resp.Body) 
resp.Body.Close() 
if err != nil { 
return nil, fmt.Errorf("parsing %s as HTML: %v", url, err) 
} 
var links []string 
visitNode := func(n *html.Node) { 
if n.Type == html.ElementNode && n.Data == "a" { 
for _, a := range n.Attr { 
if a.Key != "href" { 
continue 
} 
link, err := resp.Request.URL.Parse(a.Val) 
if err != nil { 
continue // ignore bad URLS 


} 
links = append(links, link.String()) 


} 


forEachNode(doc, visitNode, nil) 
return links, nil 


上 面 的 代码 对 之 前 的 版 本 做 了 改进 ， 现 在 links 中 存储 的 不 是 href 属 性 的 原始 值 ， 而 是 通过 
resp.Request.URL 解 析 后 的 值 。 解 析 后 ， 这 些 连接 以 绝对 路 径 的 形式 存在 ， 可 以 直接 被 
http.Get 访 问 。 


网 页 抓 取 的 核心 问题 就 是 如 何人 遍历 图 。 在 topoSort 的 例子 中 ， 已 经 展示 了 深度 优先 人 遍历， 在 网 
页 抓 取 中 ， 我 们 会 展示 如 何 用 广度 优先 遍历 图 。 在 第 8 章 ， 我 们 会 介绍 如 何 将 深度 优先 和 广度 
优先 结合 使 用 。 
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完毕 后 ， 会 返回 一 组 待 访 问 元 素 。 这 些 元 素 会 被 加 入 到 待 访 问 列表 中 。 当 待 访问 列表 中 的 所 
有 元 素 都 被 访问 后 ，breadthFirst 函 数 运行 结束 。 为 了 避免 同一 个 元 素 被 访问 两 次 ， 代 码 中 维 
护 了 一 个 map。 


gopl.io/ch5/findlinks3 


// breadthFirst calls f for each item in the worklist. 
// Any items returned by f are added to the worklist. 
// t is called at most once for each item. 
func breadthFirst(f func(item string) []string, worklist []string) { 
seen := make(map[string]bool) 
for len(worklist) > 0 { 
items := worklist 
worklist = nil 
for _, item := range items { 
if !seen[item] { 
seen[item] = true 
worklist = append(worklist, f(item)...) 


就 像 我 们 在 章节 3 解释 的 那样 ，append 的 参数 "flitem)…”， 会 将 f 返 回 的 一 组 元 素 一 个 个 添加 到 

worklist 中 。 

在 我 们 网 页 抓 取 器 中 ， 元 素 的 类 型 是 Url。crawl 函 数 会 将 URL 输 出 ， 提 取 其 中 的 新 链接 ， 并 将 
这 些 新 链接 返回 。 我 们 会 将 crawl 作 为 参数 传递 给 breadthFirst 。 


func crawl(url string) []string { 
fmt.Println(url) 


list, err := links.Extract(url) 
if err != nil { 
log.Print(err) 
} 
return list 
} 
为 了 使 抓 取 器 开始 运行 ， 我 们 用 命令 行 输入 的 参数 作为 初始 的 待 访问 url。 


func main() { 
// Crawl the web breadth-first 
// starting from the command-line arguments. 


breadthFirst(crawl, os.Args[i:]) 


让 我 们 从 https://golang.org 开始 ， 下 面 是 程序 的 输出 结果 : 


$ go build gopl.io/ch5/findlinks3 

$ ./findlinks3 https://golang.org 
https://golang.org/ 

https://golang.org/doc/ 
https://golang.org/pkg/ 
https://golang.org/project/ 
https://code.google.com/p/go-tour/ 
https://golang.org/doc/code.html 
https://www. youtube. com/watch?v=XCsL89YtqCs 
http://research. swtch.com/gotour 


当 所 有 发 现 的 链接 都 已 经 被 访问 或 电脑 的 内 存 耗 尽 时 ， 程 序 运 行 结束 。 


练习 5.10 : 重 写 topoSort 函 数 ， 用 map 代 替 切 片 并 移 除 对 key 的 排序 代码 。 验 证 结果 的 正确 性 
(结果 不 唯一 ) 。 


练习 5.11 : 现在 线性 代数 的 老师 把 微 积 分 设 为 了 前 置 课程 。 完 善 tfopSort， 使 其 能 检测 有 向 图 
中 的 环 。 

练习 5.12 : gopl.io/ch5/outline2 (5.5 节 ) 的 startElement 和 endElement 共 用 了 全 局 变量 
depth， 将 它们 修改 为 匿名 函数 ， 使 其 共享 outline 中 的 局 部 变量 。 


练习 5.13 : 修改 crawl， 使 其 能 保存 发 现 的 页 面 ， 必 要 时 ， 可 以 创建 目录 来 保存 这 些 页 面 。 只 
保存 来 自 原 始 域名 下 的 页 面 。 假 设 初始 页 面 在 golang.org 下 ， 就 不 要 保存 vimeo.com 下 的 页 
ae 


% 5.14: 使 用 breadthFirst 人 遍历 其 他 数据 结构 。 比 如 ，topoSort 例 子 中 的 课程 依赖 关系 (有 
向 图 ) ,个 人 计算 机 的 文件 层次 结构 ( 树 ) ， 你 所 在 城市 的 公交 或 地 铁 线路 (无 向 图 ) 。 
5.6.1. 警告 : 捕获 迭代 变量 


本 节 ， 将 介绍 Go 词法 作用 域 的 一 个 陷阱 。 请 务必 仔细 的 阅读 ， 弄 清楚 发 生 问题 的 原因 。 即 使 
是 经 验 丰 富 的 程序 员 也 会 在 这 个 问题 上 犯错 误 。 


考虑 这 个 样 一 个 问题 : 你 被 要 求 首先 创建 一 些 目录 ， 再 将 目录 删除 。 在 下 面 的 例子 中 我 们 用 
函数 值 来 完成 删除 操作 。 下 面 的 示例 代码 需要 引入 OS 包 。 为 了 使 代码 简单 ， 我 们 忽略 了 所 有 
的 异常 处 理 。 


var rmdirs []func() 
for _, d := range tempDirs() { 
dir := d // NOTE: necessary! 
os.MkdirAll(dir, 0755) // creates parent directories too 
rmdirs = append(rmdirs, func() { 
os.RemoveAll (dir) 


}) 

} 

// ...do some work... 

for _, rmdir := range rmdirs { 
rmdir() // clean up 

} 


你 可 能 会 感到 困惑 ， 为 什么 要 在 循环 体 中 用 循环 变量 d 赋 值 一 个 新 的 局 部 变量 ， 而 不 是 像 下 面 
的 代码 一 样 直接 使 用 循环 变量 dir。 需 要 注意 ， 下 面 的 代码 是 错误 的 。 


var rmdirs []func() 
for _, dir := range tempDirs() { 
os.MkdirAll(dir, 0755) 
rmdirs = append(rmdirs, func() { 
os.RemoveAll(dir) // NOTE: incorrect! 


}) 


问题 的 原因 在 于 循环 变量 的 作用 域 。 在 上 面 的 程序 中 ，for 循 环 语句 引入 了 新 的 词法 块 ， 循 环 
变量 dir 在 这 个 词法 块 中 被 声明 。 在 该 循环 中 生成 的 所 有 函数 值 都 共享 相同 的 循环 变量 。 需 要 
注意 ， 函 数值 中 记录 的 是 循环 变量 的 内 存 地 址 ， 而 不 是 循环 变量 某 一 时 刻 的 值 。 以 dir 为 例 ， 

后 续 的 迭代 会 不 断 更 新 dir 的 值 ， 当 删除 操作 执行 时 ，for 循 环 已 完成 ，dir 中 存储 的 值 等 于 最 后 
一 次 迭代 的 值 。 这 意味 着 ， 每 次 对 OS.RemoveAll 的 调用 删除 的 都 是 相同 的 目录 。 


通常 ， 为 了 解决 这 个 问题 ， 我 们 会 引入 一 个 与 循环 变量 同名 的 局 部 变量 ， 作 为 循环 变量 的 副 
本 。 比 如 下 面 的 变量 dir， 虽 然 这 看 起 来 很 奇怪 ， 但 却 很 有 用 。 


for _, dir := range tempDirs() { 
dir := dir // declares inner dir, initialized to outer dir 
Hf 

} 


这 个 问题 不 仅 存 在 基于 range 的 循环 ， 在 下 面 的 例子 中 ， 对 循环 变量 i 的 使 用 也 存在 同样 的 问 
题 : 


var rmdirs []func() 
dirs := tempDirs() 
for i := 0; i < len(dirs); i++ { 
os.MkdirAll(dirs[i], 0755) // OK 
rmdirs = append(rmdirs, func() { 
os.RemoveAll(dirs[i]) // NOTE: incorrect! 


}) 


如 果 你 使 用 go 语句 (第 八 章 ) 或 者 defer 语 句 (5.8 节 ) 会 经 常 遇 到 此 类 问题 。 这 不 是 go 或 
defer 本 身 导 致 的 ， 而 是 因为 它们 都 会 等 待 循环 结束 后 ， 再 执行 函数 值 。 


5.7. TZA% 


参数 数量 可 变 的 函数 称 为 为 可 变 参 数 函 数 。 典 型 的 例子 就 是 fmt.Printf 和 类 似 函 数 。Printf 首 先 
接收 一 个 的 必 备 参数 ， 之 后 接收 任意 个 数 的 后 续 参 数 。 


在 声明 可 变 参 数 函 数 时 ， 需 要 在 参数 列表 的 最 后 一 个 参数 类 型 之 前 加 上 省 略 符 号 “…”， 这 表示 
该 函数 会 接收 任意 数量 的 该 类 型 参数 。 


gopl.io/ch5/sum 


func sum(vals...int) int { 
total := 0 
for _, val := range vals { 
total += val 


} 


return total 


Sum 蜀 数 返 回 任意 个 int 型 参数 的 和 。 在 函数 体 中 ,vals 被 看 作 是 类 型 为 [| int 的 切片 。sum 可 以 接 
收 任意 数量 的 int 型 参数 : 


fmt.Println(sum()) Hf MOM 
fmt .Println(sum(3) ) Ie MENN 
fmt.Println(sum(1, 2, 3, 4)) // "10" 


在 上 面 的 代码 中 ， 调 用 者 隐 式 的 创建 一 个 数组 ， 并 将 原始 参数 复制 到 数组 中 ， 再 把 数组 的 一 
个 切片 作为 参数 传 给 被 调 函 数 。 如 果 原 始 参数 已 经 是 切片 类 型 ， 我 们 该 如 何 传递 给 sum ? RF 
在 最 后 一 个 参数 后 加 上 省 略 符 。 下 面 的 代码 功能 与 上 个 例子 中 最 后 一 条 语句 相同 。 


values := []int{i, 2, 3, 4} 
fmt.Println(sum(values...)) // "10" 


BRET ERR BAAR > int 型 参数 的 行为 看 起 来 很 像 切 片 类 型 ， 但 实际 上 ， 可 变 参 数 函 
数 和 以 切片 作为 参数 的 函数 是 不 同 的 。 


func f(...int) {} 

func g([]int) {} 

fmt .Printf("%T\n", f) 7/7 "func(...int)" 
fmt.Printf("%T\n", g) // "func([]Jint)" 


可 变 参 数 函 数 经 常 被 用 于 格式 化 字符 串 。 下 面 的 errorf 骂 数 构造 了 一 个 以 行 号 开头 的 ， 经 过 格 
式 化 的 错误 信息 。 函 数 名 的 后 组 f 是 一 种 通用 的 命名 规范 ， 代 表 该 可 变 参数 函数 可 以 接收 Printf 
风格 的 格式 化 字符 囊 。 


func errorf(linenum int, format string, args ...interface{}) { 
fmt.Fprintf(os.Stderr, "Line %d: ", linenum) 
fmt.Foprintf(os.Stderr, format, args...) 
fmt.Fprintln(os.Stderr) 


linenum, name := 12, "count" 
errorf(linenum, "undefined: %s", name) // "Line 12: undefined: count" 


interfacf{f} 表 示 函 数 的 最 后 一 个 参数 可 以 接收 任意 类 型 ， 我 们 会 在 第 7 章 详细 介绍 。 


练习 5.15 : 编写 类 似 sSum 的 可 变 参 数 函 数 max 和 min。 考 虑 不 传 参 时 ，max 和 min 该 如 何 处 
理 ， 再 编写 至 少 接收 1 个 参数 的 版 本 。 


练习 5.16 : 编写 多 参数 版 本 的 strings.Join。 


练习 5.17 : 编写 多 参数 版 本 的 ElementsByTagName， 芳 数 接收 一 个 HTML 结 点 树 以 及 任意 数 
量 的 标签 名 ， 返 回 与 这 些 标签 名 匹配 的 所 有 元 素 。 下 面 给 出 了 2 个 例子 : 


func ElementsByTagName(doc *html.Node, name...string) []*html.Node 
images := ElementsByTagName(doc, "img") 
headings := ElementsByTagName(doc, "hi", "h2", "h3", "h4") 


5.8. Deferred % 2 


在 findLinks 的 例子 中 ， 我 们 用 http.Get 的 输出 作为 html.Parse 的 输入 。 只 有 url 的 内 容 的 确 是 
HTML 格 式 的 ，html.Parse 才 可 以 正常 工作 ， 但 实际 上 ，url 指 向 的 内 容 很 丰富 ， 可 能 是 图 片 ， 
纯 文 本 或 是 其 他 。 将 这 些 格式 的 内 容 传 递 给 html.parse， 会 产生 不 良 后 果 。 


下 面 的 例子 获取 HTML 页 面 并 输出 页 面 的 标题 。title 有 函数 会 检查 服务 器 返回 的 Content-Type 字 
段 ， 如 果 发 现 页 面 不 是 HTML ， 将 终止 函数 运行 ， 返 回 错误 。 


gopl.io/ch5/title1 


func title(url string) error { 

resp, err := http.Get(url) 

if err != nil £ 
return err 

} 

// Check Content-Type is HTML (e.g., "text/html;charset=utf-8"). 

ct := resp.Header.Get("Content-Type") 

if ct != "text/html" && !strings.HasPrefix(ct,"text/html;") { 
resp.Body.Close() 
return fmt.Errorf("%s has type %s, not text/html",url, ct) 


doc, err := html.Parse(resp.Body) 
resp.Body.Close() 


if err != nil { 
return fmt.Errorf("parsing %s as HTML: %v", url,err) 
} 
visitNode := func(n *html.Node) { 
if n.Type == html.ElementNode && n.Data == "title"&&n.FirstChild != nil { 
fmt.Println(n.FirstChild.Data) 
} 
} 


forEachNode(doc, visitNode, nil) 
return nil 


$ go build gopl.io/ch5/title1 

$ ./title1l http://gopl.io 

The Go Programming Language 

$ ./title1 https://golang.org/doc/effective_go.html 

Effective Go - The Go Programming Language 

$ ./title1 https://golang.org/doc/gopher/frontpage.png 

title: https://golang.org/doc/gopher/frontpage.png has type image/png, not text/html 


resp.Body close 调用 了 多 次 ， 这 是 为 了 确保 title 在 所 有 执行 路 径 下 (即使 函数 运行 失败 ) 都 关 
闭 了 网 络 连接 。 随 着 函数 变 得 复杂 ， 需 要 处 理 的 错误 也 变 多 ， 维 护 清 理 逻 辑 变 得 越 来 越 困 
难 。 而 Go 语言 独 有 的 defer 机 制 可 以 让 事情 变 得 简单 。 


你 只 需要 在 调用 首 通 函数 或 方法 前 加 上 关键 字 defer， 就 完成 了 defer 所 需要 的 语法 。 当 defer 语 
句 被 执行 时 ， 跟 在 defer 后 面 的 函数 会 被 延迟 执行 。 直 到 包含 该 defer 语 句 的 函数 执行 完毕 时 ， 
defer 后 的 济 数 才 会 被 执行 ， 不 论 包含 defer 语 句 的 函数 是 通过 return 正 常 结束 ， 还 是 由 于 panic 
导致 的 异常 结束 。 你 可 以 在 一 个 函数 中 执行 多 条 defer 语 句 ， 它 们 的 执行 顺序 与 声明 顺序 相 
反 。 


defer 语 句 经 常 被 用 于 处 理 成 对 的 操作 ， 如 打开 、 关 闭 、 连 接 、 断 开 连 接 、 加 锁 、 释 放 锁 。 通 
过 defer 机 制 ， 不 论 函 数 逻 辑 多 复杂 ， 都 能 保证 在 任何 执行 路 径 下 ， 资 源 被 释放 。 释 放 资 源 的 
defer 应 该 直接 跟 在 请 求 资源 的 语句 后 。 在 下 面 的 代码 中 ， 一 条 defer 语 句 蔡 代 了 之 前 的 所 有 
resp.Body.Close 


gopl.io/ch5/title2 


func title(url string) error { 

resp, err := http.Get(url) 

if err != nil { 
return err 

} 

defer resp.Body.Close() 

ct := resp.Header.Get("Content-Type") 

if ct != "text/html" && !strings.HasPrefix(ct,"text/html;") { 
return fmt.Errorf("%s has type %s, not text/html",url, ct) 

} 

doc, err := html.Parse(resp.Body) 

if err != nil { 
return fmt.Errorf("parsing %s as HTML: %v", url,err) 

} 

// ...print doc's title element... 

recunrn nil 


在 处 理 其 他 资源 时 ， 也 可 以 采用 defer 机 制 ， 比 如 对 文件 的 操作 : 


io/ioutil 


package ioutil 
func ReadFile(filename string) ([]byte, error) { 
f, err := os.Open( filename) 
if err != nil { 
return nil, err 
} 
defer f.Close() 
return ReadAll(f) 


或 是 处 理 互 斥 锁 (9.2% ) 


var mu sync.Mutex 
var m = make(map[string]int) 
func lookup(key string) int { 
mu.Lock() 
defer mu.Unlock() 
return m[key] 


调试 复杂 程序 时 ，defer 机 制 也 常 被 用 于 记录 何 时 进入 和 退出 函数 。 下 例 中 的 
bigSlowOperation 函数 ， 直 接 调 用 trace 记 录 函 数 的 被 调情 况 。bigSlowOperation 被 调 时 ， 


trace 会 返回 一 个 函数 值 ， 该 函数 值 会 在 bigSlowOperation 退 出 时 被 调用 。 通 过 这 种 方式 ， 我 
们 可 以 只 通过 一 条 语 钉 控 和 en 如 例 
子 中 的 start。 需 要 注意 一 点 : 不 要 忘记 defer 语 名 后 的 圆 括号 ， 否 则 本 该 在 进入 时 执行 的 操作 


会 在 退出 时 执行 ， T ， 永 远 不 会 被 执行 。 
gopl.io/ch5/trace 


func bigSlowOperation() { 
defer trace("bigSlowOperation")() // don't forget the 
extra parentheses 
A LOES Oty WOK... 
time.Sleep(10 * time.Second) // simulate slow 
operation by sleeping 
} 
func trace(msg string) func() { 
start := time.Now() 
log.Printf("enter %s", msg) 
return func() { 
log.Printf("exit %s (%s)", msg,time.Since(start) ) 


} 


每 一 次 bigSlowOperation 被 调用 ， 程 序 都 会 记录 兄 数 的 进入 ， 退 出 ， 持 续 时 间 。 (RNA 
time.Sleep 模 拟 一 个 耗 时 的 操作 ) 


$ go build gopl.io/ch5/trace 

$ ./trace 

2015/11/18 09:53:26 enter bigSlowOperation 

2015/11/18 09:53:36 exit bigSlowOperation (10.000589217s) 


我 们 知道 ，defer 语 如 中 的 函数 会 在 return 语 名 更 新 返回 值 变量 后 再 执行 ， 又 因为 在 函数 中 定义 
的 匿名 未 数 可 以 访问 该 函数 包括 返回 值 变 量 在 内 的 所 有 变量 ， 所 以 ， 对 匿名 函数 采用 defer 机 
制 ， 可 以 使 其 观察 函数 的 返回 值 。 


vAdouble $ žk A 4% : 


func double(x int) int { 
return x + x 


} 


我 们 只 需要 首先 命名 double 的 返回 值 ， 再 增加 defer 语 句 ， 我 们 就 可 以 在 double 每 次 被 调用 
时 ， 输 出 参数 以 及 返回 值 。 


func double(x int) (result int) { 
defer func() { fmt.Printf("double(%d) = %d\n", x,result) }() 
return X + X 


} 

_ = double(4) 

// Output: 

// “double(4) = 8" 


可 能 doulbe 艺 数 过 于 简单 ， 看 不 出 这 个 小 技巧 的 作用 ， 但 对 于 有 许多 return 语 句 的 函数 而 言 ， 
这 个 技巧 很 有 用 。 


被 延迟 执行 的 匿名 部 数 甚至 可 以 修改 函数 返回 给 调用 者 的 返回 值 


func triple(x int) (result int) { 
defer func() { result += x }() 
return double(x) 


} 
fmt.Println(triple(4)) // "12" 


在 循环 体 中 的 defer 语 锋 需 要 特别 注意 ， 因 为 只 有 在 函数 执行 完毕 后 ， 这 些 被 延迟 的 函数 才 会 
执行 。 下 面 的 代码 会 导致 系统 的 文件 描述 符 耗 尽 ， 因 为 在 所 有 文件 都 被 处 理 之 前 ， 没 有 文件 
会 被 关闭 。 


for _, filename := range filenames { 
f, err := os.Open( filename) 
if err != nil { 
return err 
} 
defer f.Close() // NOTE: risky; could run out of file 
descriptors 
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一 种 解决 方法 是 将 循环 体 中 的 defer 语 句 移 至 另外 一 个 函数 。 在 每 次 循环 时 ， 调 用 这 个 函数 。 


for _, filename := range filenames { 
if err := doFile(filename); err != nil { 
return err 


} 


func doFile(filename string) error { 
f, err := os.Open(filename) 
if err != nil { 
return err 


} 
defer f.Close() 
Jf Me process fs 


下 面 的 代码 是 fetch (1.57) 的 改进 版 ， 我 们 将 http 响 应 信息 写 入 本 地 文件 而 不 是 从 标准 输出 
流 输 出 。 我 们 通过 path.Base 提 出 url 路 径 的 最 后 一 段 作 为 文件 名 。 


gopl.io/ch5/fetch 


// Fetch downloads the URL and returns the 
// name and length of the local file. 
func fetch(url string) (filename string, n int64, err error) { 
resp, err := http.Get(url) 
if err != nil { 
return "", 0, err 
} 
defer resp.Body.Close() 
local := path.Base(resp.Request.URL.Path) 
if local == "/" { 
local = "index.html" 


f, err := os.Create(local) 
if err != nil { 
nevi We Oh enn 


n, err = i0.Copy(f, resp.Body) 
// Close file, but prefer error from Copy, if any. 
if closeErr := f.Close(); err == nil { 

err = closeErr 


} 


return local, n, err 


对 resp.Body.Close 延 迟 调 用 我 们 已 经 见 过 了 ， 在 此 不 做 解释 。 上 例 中 ， 通 过 os.Create 打 开 文 
件 进行 写 入 ， 在 关闭 文件 时 ， 我 们 没有 对 f.close 采 用 defer 机 制 ， 因 为 这 会 产生 一 些微 妙 的 错 
误 。 许 多 文件 系统 ， 尤 其 是 NFS， 写 入 文件 时 发 生 的 错误 会 被 延迟 到 文件 关闭 时 反馈 。 如 果 
没有 检查 文件 关闭 时 的 反馈 信息 ， 可 能 会 导致 数据 丢失 ， 而 我 们 还 误 以 为 写 入 操作 成 功 。 如 
果 io.Copy 和 f.close 都 失败 了 ， 我 们 倾向 于 将 io.Copy 的 错误 信息 反馈 给 调用 者 ， 因 为 它 先 于 
fclose 发 生 ， 更 有 可 能 接近 问题 的 本 质 。 


练习 5.18 : 不 修改 fetch 的 行为 ， 重 写 fetch 有 函数 ， 要 求 使 用 defer 机 制 关 闭 文 件 。 


5.9. Panic 弄 常 


Go 的 类 型 TENA 天 很 多 错误 ， 但 有 些 错误 只 能 在 运行 时 检查 ， 如 数组 访问 越界 、 
空 指针 引用 等 。 这 些 运 行 时 错误 会 引起 painc 异 常 。 


一 般 而 言 ， 当 panic 异 常 发 生 时 ， 程 序 会 中 断 运行 ， 并 立即 执行 在 该 goroutine ed 
pe ， 在 第 8 章 会 详细 介绍 ) 中 被 延迟 的 函数 (defer 机 制 ) 。 随 后 ， 程 序 崩 溃 并 输出 日 志 

。 日 志 信 息 包括 panic value 和 元 数 调 用 的 堆栈 跟踪 信息 。panic value 通 常 是 某 种 错 — 

。 对 于 每 个 goroutine ， 日志 信 息 中 都 会 有 与 之 相对 的 ， 发 生 panic 时 的 函数 调用 堆栈 跟踪 信 
息 。 通 常 ， 我 们 不 需要 再 次 运行 程序 去 定位 问题 ， 日 志 信 息 已 经 提供 了 足够 的 诊断 依据 。 
此 ， 在 我 们 填写 问题 报告 时 ， 一 般 会 将 panic 异 常 和 日 志 信 息 一 并 记录 。 


(> cE 
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数 接受 任何 值 作为 参数 。 当 某 些 不 应 该 发 生 的 场景 发 生 时 ， 我 们 就 应 该 调用 panic。 比 如 ， 当 
程序 到 达 了 某 条 逻辑 上 不 可 能 到 达 的 路 径 : 


switch s := suit(drawCard()); s { 
case "Spades": LA a 
case "Hearts": ee: 
case "Diamonds": el acne 
case "Clubs": A 
default: 
panic(fmt.Sprintf("invalid suit %q", s)) // Joker? 
} 
断言 函数 必须 满足 的 前 置 条 件 是 明智 的 做 法 ， 但 这 很 容易 被 滥用 。 we 能 提供 更 多 的 错误 
信息 ， 或 者 能 更 决 速 的 发 现 错误 ， 否则 不 需要 使 用 断言 ， 编 译 器 在 运行 时 会 帮 你 检查 代码 。 


func Reset(x *Buffer) { 
if x == nil { 
panic("x is nil") // unnecessary! 
} 


x.elements = nil 


虽然 Go 的 panic 机 制 类 似 于 其 他 语言 的 异常 ， 但 panic 的 适用 场景 有 一 些 不 同 。 由 于 panic 会 引 
起 程序 的 崩溃 ， 因 此 panic 一 般 用 于 严重 错误 ， 如 程序 内 部 的 逻辑 不 一 致 。 勤 奋 的 程序 员 认 为 
任何 崩溃 都 表明 代码 中 存在 漏洞 ， 所 以 对 于 大 部 分 汤 洞 ， 我 们 应 该 使 用 Go 提供 的 错误 机 制 ， 

而 不 是 panic， 尽 量 避 免 程 序 的 崩溃 。 在 健壮 的 程序 中 ， 任 何 可 以 预料 到 的 错误 ， 如 不 正确 的 
输入 、 错 误 的 配置 或 是 失败 的 IO 操作 都 应 该 被 优雅 的 处 理 ， 最 好 的 处 理 方 式 ， 就 是 使 用 Go 的 
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考虑 regexp.Compile 函 数 ， 该 函数 将 正则 表达 式 编译 成 有 效 的 可 匹配 格式 。 当 输入 的 正则 表 
达 式 不 合法 时 ， 该 函数 会 返回 一 个 错误 。 当 调用 者 明确 的 知道 正确 的 输入 不 会 引起 函数 错误 
时 ， 要 求 调用 者 检查 这 个 错误 是 不 必要 和 累 痪 的 。 我 们 应 该 假设 函数 的 输入 一 直人 合法， 就 如 
前 面 的 断言 一 样 : 当 调 用 者 输入 了 不 应 该 出 现 的 输入 时 ， 触 发 panic 异 常 。 


在 程序 源码 中 ， 大 多 数 正则 表达 式 是 字符 串 字 面值 (string literals) ， 因 此 regexp 包 提供 了 包 
装 函 数 regexp.MustCompile 检 查 输入 的 合法 性 。 


package regexp 
func Compile(expr string) (*Regexp, error) { /* ... */ } 
func MustCompile(expr string) *Regexp { 
re, err := Compile(expr) 
if err != nil { 
panic(err) 
} 


return re 


Ww 


包装 函数 使 得 调用 者 可 以 便捷 的 用 一 个 编译 后 的 正则 表达 式 为 包 级 别 的 变量 赋值 : 


var httpSchemeRE = regexp.MustCompile( ^https?: ) //"http:" or "https:" 


显然 ，MustCompile 不 能 接收 不 合法 的 输入 。 函 数 名 中 的 Must 前 组 是 一 种 针对 此 类 函数 的 命 
名 约定 ， 比 如 template.Must (4.6 节 ) 


func main() { 


f(3) 
} 
func f(x int) { 
fmt.Printf("f(%d)\n", x+0/x) // panics if x == 0 
defer fmt.Printf("defer %d\n", x) 
f(x - 1) 
} 


上 例 中 的 运行 输出 如 下 : 


F(3) 
F(2) 
f(1) 
defer 1 
defer 2 
defer 3 


当 f(0) 被 调用 时 ， 发 生 panic 异 常 ， 之 前 被 延迟 执行 的 的 3 个 fmt.Printf 被 调用 。 程 序 中 断 执行 
后 ，panic 信 息 和 堆栈 信息 会 被 输出 (下 面 是 简化 的 输出 ) 


panic: runtime error: integer divide by zero 
main. f(0) 
src/gopl.io/ch5/defer1/defer.go:14 
main. f(1) 
src/gopl.io/ch5/defer1/defer .go:16 
main. f(2) 
src/gopl.io/ch5/deferi/defer .go:16 
main. f(3) 
src/gopl.io/ch5/defer1/defer .go:16 
main.main() 
src/gopl.io/ch5/defer1/defer.go:10 
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为 了 方便 诊断 问题 ，runtime 包 允许 程序 员 输 出 堆栈 信息 。 在 下 面 的 例子 中 ， 我 们 通过 在 main 
函数 中 延迟 调用 printStack 输 出 堆栈 信息 。 


gopl.io/ch5/defer2 
func main() { 
defer printStack() 
F(3) 
} 
func printStack() { 
var buf [4096]byte 
n := runtime.Stack(buf[:], false) 
os.Stdout.write(buf[:n]) 


printStack 的 简化 输出 如 下 (下面 只 是 printStack 的 输出 ， 不 包括 panic 的 日 志 信息 ) 


goroutine 1 [running]: 
main.printStack() 
src/gopl.io/ch5/defer2/defer .go:20 
main. f(0) 
src/gopl.io/ch5/defer2/defer.go:27 
main. f(1) 
src/gopl.io/ch5/defer2/defer .go:29 
main. f(2) 
src/gopl.io/ch5/defer2/defer.go:29 
main. f(3) 
src/gopl.io/ch5/defer2/defer .go:29 
main.main() 
src/gopl.io/ch5/defer2/defer.go:15 


将 panic 机 制 类 比 其 他 语言 异常 机 制 的 读者 可 能 会 惊讶 ，runtime.Stack 为 何 能 输出 已 经 被 释放 
函数 的 信息 ?在 Go 的 panic 机 制 中 ， 延 迟 函 数 的 调用 在 释放 堆栈 信息 之 前 。 
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5.10. Recover 捕 获 异 常 


通常 来 说 ， 不 应 该 对 panic 异 常 做 任何 处 理 ， 但 有 时 ， 也 许 我 们 可 以 从 异常 中 恢复 ， 至 少 我 们 
可 以 在 程序 崩 演 前， 做 一 些 操作 。 举 个 例子 ， 当 Web 服务 器 遇 到 不 可 预料 的 严重 问题 时 ， 在 崩 
溃 前 应 该 将 所 有 的 连接 关闭 ; 如 果 不 做 任何 处 理 ， 会 使 得 客户 端 一 直 处 于 等 待 状态 。 如 果 web 
服务 器 还 在 开发 阶段 ， 服 务 器 甚至 可 以 将 异常 信息 反馈 到 客户 端 ， 帮 助 调试 。 


如 果 在 deferred 函 数 中 调用 了 内 置 函 数 recover， 并 且 定义 该 defer 语 名 的 函数 发 生 了 panic 异 
常 ，recover 会 使 程序 从 panic 中 恢复 ， 并 返回 panic value。 导 致 panic 异 常 的 函数 不 会 继续 运 
行 ， 但 能 正常 返回 。 在 未 发 生 panic 时 调用 recover，recover 会 返回 nil 。 


让 我 们 以 语言 解析 器 为 例 ， 说 明 recover 的 使 用 场景 。 考 虑 到 语言 解析 器 的 复杂 性 ， 即 使 某 个 
语言 解析 器 目前 工作 正常 ， 也 无 法 肯定 它 没 有 漏洞 。 因 此 ， 当 某 个 异常 出 现时 ， 我 们 不 会 选 
择 让 解析 器 崩溃 ， 而 是 会 将 panic 异 常 当 作 普 通 的 解析 错误 ， 并 附加 额外 信息 提醒 用 户 报告 此 


错误 。 


func Parse(input string) (s *Syntax, err error) { 
defer func() { 
if p := recover(); p != nil { 
err = fmt.Errorf("internal error: %v", p) 


deferred & 3k 4# 84ParseXpanic ? K4 ° deferred h% AZ > panic value 被 附加 到 错误 信息 
中 ; 并 用 err 变 量 接 收 错 误 信 息 ， 返 回 给 调用 者 。 我 们 也 可 以 通过 调用 runtime.Stack 往 错误 信 
息 中 添加 完整 的 堆栈 调用 信息 。 


不 加 区 分 的 恢复 所 有 的 panic 异 常 ， 不 是 可 取 的 做 法 ; 因为 在 panic 之 后 ， 无 法 保证 包 级 变量 的 
状态 仍然 和 我 们 预期 一 致 。 比 如 ， 对 数据 结构 的 一 次 重要 更 新 没有 被 完整 完成 、 文 件 或 者 网 
络 连接 没有 被 关闭 、 获 得 的 锁 没 有 被 释放 。 此 外 ， 如 果 写 日 志 时 产生 的 panic 被 不 加 区 分 的 恢 
复 ， 可 能 会 导致 漏洞 被 忽略 。 


虽然 把 对 panic 的 处 理 都 集中 在 一 个 包 下 ， 有 助 于 简化 对 复杂 和 不 可 以 预料 问题 的 处 理 ， 但 作 
为 被 广泛 遵守 的 规范 ， 你 不 应 该 试图 去 恢复 其 他 包 引 起 的 panic。 公 有 的 API 应 该 将 函数 的 运 
行 失败 作为 error 返 回 ， 而 不 是 panic。 同 样 的 ， 你 也 不 应 该 恢复 一 个 由 他 人 开发 的 函数 引起 的 
panic， 比 如 说 调用 者 传 入 的 回调 函数 ， 因 为 你 无 法 确保 这 样 做 是 安全 的 。 


有 时 我 们 很 难 完全 遵循 规范 ， 举 个 例子 ，net/http 包 中 提供 了 一 个 web 服 务 器 ， 将 收 到 的 请 求 
分 发 给 用 户 提 供 的 处 理 函 数 。 很 显然 ， 我 们 不 能 因为 某 个 处 理 函 数 引 发 的 panic 蜡 常 ， 杀 掉 整 
个 进程 ; Web 服 务 器 遇 到 处 理 函 数 导致 的 panic 时 会 调用 recover， 输 出 堆栈 信息 ， 继 续 运 行 。 


这 样 的 做 法 在 实践 中 很 便捷 ， 但 也 会 引起 资源 泄漏 ， 或 是 因为 recover 操 作 ， 导 致 其 他 问题 。 


基于 以 上 原因 ， 安 全 的 做 法 是 有 选择 性 的 recover。 换 名 话说 ， 只 恢复 应 该 被 恢复 的 panic 异 
常 ， 此 外 ， 这 些 异 常 所 占 的 比例 应 该 尽 可 能 的 低 。 为 了 标识 某 个 panic 是 否 应 该 被 恢复 ， 我 们 

ae value 设 置 成 特殊 类 型 。 在 recover 时 对 panic value 进 行 检查 ， 如 果 发 现 panic 

value 是 特殊 类 型 ， 就 将 这 个 panic 作 为 errror 处 理 ， 如 果 不 是 ， 则 按照 正常 的 panic 进 行 处 理 
(在 下 面 的 例子 中 ， 我 们 会 看 到 这 种 方式 ) © 


下 面 的 例子 是 title 有 函数 的 变形 ， 如 果 HTML 页 面包 含 多 个 <title> ， 该 函数 会 给 调用 者 返回 一 
个 错误 (error) 。 在 soleTitle 内 部 处 理 时 ， 如 果 检 测 到 有 多 个 <title> ， 会 调用 panic， 阻 止 
函数 继续 递归 ， 并 将 特殊 类 型 bailout 作 为 panic 的 参数 。 


// soleTitle returns the text of the first non-empty title element 
// in doc, and an error if there was not exactly one. 
func soleTitle(doc *html.Node) (title string, err error) { 
type bailout struct{} 
defer func() { 
switch p := recover(); p { 
case nil: // no panic 
case bailout{}: // "expected" panic 
err = fmt.Errorf("multiple title elements") 
default: 
panic(p) // unexpected panic; carry on panicking 
} 
}() 


// Bail out of recursion if we find more than one nonempty title. 
forEachNode(doc, func(n *html.Node) { 


if n.Type == html.ElementNode && n.Data == "title" && 
n.FirstChild != nil { 
if title != "" { 
panic(bailout{}) // multiple titleelements 
} 
title = n.FirstChild.Data 
} 
dyads) 
if title == "" { 


return fm Errori (Ano titles eliement.) 


} 


return title, nil 


Eal P > deferred & 274 Fl recover > #42 panic value ° 4 panic value 是 bailout 人 } 类 型 时 ， 
deferred 有 函数 生成 一 个 error 返 回 给 调用 者 。 当 panic value 是 其 他 non-nil 值 时 ， 表 示 发 生 了 未 知 
的 panic 姑 常 ，deferred 函 数 将 调用 panic 函 数 并 将 当前 的 panic value 作 为 参数 传 入 ; 此 时 ， 等 
同 于 recover 没 有 做 任何 操作 。 (请 注意 : 在 例子 中 ， 对 可 预期 的 错误 采用 了 panic， 这 违反 了 
之 前 的 建议 ， 我 们 在 此 只 是 想 向 读者 演示 这 种 机 制 。) 


有 些 情况 下 ， 我 们 无 法 恢复 。 某 些 致命 错误 会 导致 Go 在 运行 时 终止 程序 ， 如 内 存 不 足 。 
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第 六 章 方法 
从 90 年 代 早 期 开始 ， 面 向 对 象 编程 (OOP) 就 成 为 了 称霸 工程 界 和 教育 界 的 编程 范式 ， 所 以 之 
后 几乎 所 有 大 规模 被 应 用 的 语言 都 包含 了 对 OOP 的 支持 ，go 语 言 也 不 例外 。 


尽管 没有 被 大 众 所 接 受 的 明确 的 OOP 的 定义 ， 从 我 们 的 理解 来 讲 ， 一 个 对 象 其 实 也 就 是 一 个 
简单 的 值 或 者 一 个 变量 ， 在 这 个 对 象 中 会 包含 一 些 方法 ， 而 一 个 方法 则 是 一 个 一 个 和 特殊 类 
型 关联 的 函数 。 一 个 面向 对 象 的 程序 会 用 方法 来 表达 其 属性 和 对 应 的 操作 ， 这 样 使 用 这 个 对 
象 的 用 户 就 不 需要 直接 去 操作 对 象 ， 而 是 借助 方法 来 做 这 些 事情 。 


在 早 些 的 章节 中 ， 我 们 已 经 使 用 了 标准 库 提供 的 一 些 方 法 ， 比 如 time.Duration 这 个 类 型 的 
Seconds 方 法 : 


const day = 24 * time.Hour 
fmt.Println(day.Seconds()) // "86400" 


并 且 在 2.5 节 中 ， 我 们 定义 了 一 个 自己 的 方法 ，Celsius 类 型 的 String 方 法 : 


func (c Celsius) String() string { return fmt.Sprintf("%g°C", c) } 


在 本 章 中 ，OOP 编 程 的 第 一 方面 ， 我 们 会 向 你 展示 如 何 有 效 地 定义 和 使 用 方法 。 我 们 会 履 盖 
到 OOP 编 程 的 两 个 关键 点 ， 封 装 和 组 合 。 


6.1. 方法 声明 


在 函数 声明 时 ， 在 其 名 字 之 前 放 上 一 个 变量 ， 即 是 一 个 方法 。 这 个 附加 的 参数 会 将 该 函数 附 
加 到 这 种 类 型 上 ， 即 相当 于 为 这 种 类 型 定义 了 一 个 独占 的 方法 。 


下 面 来 写 我 们 第 一 个 方法 的 例子 ， 这 个 例子 在 package geometry 下 : 


gopl.io/ch6/geometry 


package geometry 
import "math" 
type Point struct{ X, Y float64 } 


// traditional function 
func Distance(p, q Point) float64 { 
return math.Hypot(q.X-p.X, q.Y-p.Y) 


} 


// same thing, but as a method of the Point type 
func (p Point) Distance(q Point) float64 { 
return math.Hypot(q.X-p.X, q.Y-p.Y) 


} 


上 面 的 代码 里 那个 附加 的 参数 D， 叫 做 方法 的 接收 器 (receiver)， 早 期 的 面向 对 象 语言 留 下 的 遗 
产 将 调用 一 个 方法 称 为 "向 一 个 对 象 发 送 消息 "。 


在 Go 语言 中 ， 我 们 并 不 会 像 其 它 语言 那样 用 this 或 者 self 作 为 接收 器 ; 我 们 可 以 任意 的 选择 接 
收回 的 名 字 。 由 于 接收 器 的 名 字 经 常会 被 使 用 到 ， 所 以 保持 其 在 方法 间 传 递 时 的 一 致 性 和 简 
短 性 是 不 错 的 主意 。 这 里 的 建议 是 可 以 使 用 其 类 型 的 第 一 个 字母 ， 比 如 这 里 使 用 了 Point 的 首 
字母 p。 


在 方法 调用 过 程 中 ， 接 收 器 参数 一 般 会 在 方法 名 之 前 出 现 。 这 和 方法 声明 是 一 样 的 ， 都 是 接 
收 器 参数 在 方法 名 字 之 前 。 下 面 是 例子 : 


p := Point{i, 2} 

q := Point{4, 6} 

fmt.Printlin(Distance(p, q)) // "5", function call 
fmt.Println(p.Distance(q)) // "5", method call 


可 以 看 到 ， 上 面 的 两 个 函数 调用 都 是 Distance， 但 是 却 没有 发 生 冲 突 。 第 一 个 Distance 的 调用 
实际 上 用 的 是 包 级 别 的 函数 geometry.Distance， 而 第 二 个 则 是 使 用 刚刚 声明 的 Point， 调 用 的 
是 Point 类 下 声明 的 Point.Distance 方 法 。 


这 种 p.Distance 的 表达 式 叫 做 选择 器 ， 因 为 他 会 选择 合适 的 对 应 p 这 个 对 象 的 Distance 方 法 来 
执行 。 选 择 器 也 会 被 用 来 选择 一 个 struct 类 型 的 字段 ， 比 如 p.X。 由 于 方法 和 字段 都 是 在 同一 
命名 空间 ， 所 以 如 果 我 们 在 这 里 声明 一 个 X 方 法 的 话 ， 编 译 器 会 报错 ， 因 为 在 调用 p.X 时 会 有 
歧义 (译注 : 这 里 确实 插 奇 怪 的 ) 。 

为 每 种 类 型 都 有 其 方法 的 命名 空间 ， 我 们 在 用 Distance 这 个 名 字 的 时 候 ， 不 同 的 Distance 调 


用 指向 了 不 同类 型 里 的 Distance 方 法 。 让 我 们 来 定义 一 个 Path 类 型 ， 这 个 Path 代 表 一 个 线段 
的 集合 ， 并 且 也 给 这 个 Path 定 义 一 个 叫 Distance 的 方法 。 


// A Path is a journey connecting the points with straight lines. 
type Path []Point 
// Distance returns the distance traveled along the path. 
func (path Path) Distance() floaté4 { 
sum := 0.0 


for i := range path { 
ifi>of 
sum += path[i-1].Distance(path[i] ) 
} 
} 


return sum 


Path 是 一 个 命名 的 slice 类 型 ， 而 不 是 Point 那 样 的 struct 类 型 ， 然 而 我 们 依然 可 以 为 它 定义 方 
法 。 在 能 够 给 任意 类 型 定义 方法 这 一 点 上 ，Go 和 很 多 其 它 的 面向 对 象 的 语言 不 太一 样 。 因 此 
在 Go 语言 里 ， 我 们 为 一 些 简 单 的 数值 、 字 符 串 、slice、map 来 定义 一 些 附 加 行为 很 方便 。 方 
法 可 以 被 声明 到 任意 类 型 ， 只 要 不 是 一 个 指针 或 者 一 个 interface。 

两 个 Distance 方 法 有 不 同 的 类 型 。 他 们 两 个 方法 之 间 没 有 任何 关系 ， 尽 管 Path 的 Distance 方 法 
会 在 内 部 调用 Point.Distance 方 法 来 计算 每 个 连接 邻接 点 的 线段 的 长 度 。 


让 我 们 来 调用 一 个 新 方法 ， 计 算 三 角形 的 周 长 : 


perim := Path{ 


{1, 1}, 
{5, 1}, 
{5, 4}, 
{1, 1}, 
} 
fmt.Println(perim.Distance()) // "12" 


在 上 面 两 个 对 Distance 名 字 的 方法 的 调用 中 ， 编 译 器 会 根据 方法 的 名 字 以 及 接收 器 来 决定 具体 
调用 的 是 哪 一 个 函数 。 第 一 个 例子 中 path[i-1] 数 组 中 的 类 型 是 Point， 因 此 Point.Distance 这 个 
方法 被 调用 ; 在 第 二 个 例子 中 perim 的 类 型 是 Path， 因 此 Distance 调 用 的 是 Path.Distance ° 


对 于 一 个 给 定 的 类 型 ， 其 内 部 的 方法 都 必须 有 唯一 的 方法 名 ， 但 是 不 同 的 类 型 却 可 以 有 同样 
的 方法 名 ， 比 如 我 们 这 里 Point 和 Path 就 都 有 Distance 这 个 名 字 的 方法 ; 所 以 我 们 没有 必要 非 
在 方法 名 之 前 加 类 型 名 来 消除 歧义 ， 比 如 PathDistance。 这 里 我 们 已 经 看 到 了 方法 比 之 函数 
的 一 些 好 处 : 方法 名 可 以 简短 。 当 我 们 在 包 外 调用 的 时 候 这 种 好 处 就 会 被 放大 ， 因 为 我 们 可 
以 使 用 这 个 短 名 字 ， 而 可 以 省 略 掉 包 的 名 字 ， 下 面 是 例子 : 


import "gopl.io/ch6/geometry" 


perim := geometry.Path{{1, i}, {5, 1}, {5, 4}, {1, 1}} 
fmt.Println(geometry.Path.Distance(perim)) // "12", standalone function 
fmt .Println(perim.Distance()) // "12", method of geometry.Path 


译注 : 如 果 我 们 要 用 方法 去 计算 perim 的 distance， 还 需要 去 写 全 geometry 的 包 名 ， 和 其 函数 
名 ， 但 是 因为 Path 这 个 变量 定义 了 一 个 可 以 直接 用 的 Distance 方 法 ， 所 以 我 们 可 以 直接 写 
perim.Distance()。 相 当 于 可 以 少 打 很 多 字 ， 作 者 应 该 是 这 个 意思 。 因 为 在 Go 里 包 外 调用 函数 
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6.2. 基于 指针 对 人 象 的 方法 


当 调 用 一 个 函数 时 ， 会 对 其 每 一 个 参数 值 进行 拷贝 ， 如 果 一 个 函数 需要 更 新 一 个 变量 ， 或 者 
函数 的 其 中 一 个 参数 实在 太 大 我 们 希望 能 够 避免 进行 这 种 默认 的 拷贝 ， 这 种 情况 下 我 们 就 需 
要 用 到 指针 了 。 对 应 到 我 们 这 里 用 来 更 新 接收 器 的 对 象 的 方法 ， 当 这 个 接受 者 变量 本 身 比 较 
大 时 ， 我 们 就 可 以 用 其 指针 而 不 是 对 象 来 声明 方法 ， 如 下 : 


func (p *Point) ScaleBy(factor float64) { 
p.X *= factor 
p.Y *= factor 


这 个 方法 的 名 字 是 (*Point).ScaleBy 。 这 里 的 括号 是 必须 的 ; 没有 括号 的 话 这 个 表达 式 可 能 
会 被 理解 为 *(point.ScaleBy) ° 


在 现实 的 程序 里 ， 一 般 会 约定 如 果 Point 这 个 类 有 一 个 指针 作为 接收 器 的 方法 ， 那 么 所 有 Point 
的 方法 都 必须 有 一 个 指针 接收 器 ， 即 使 是 那些 并 不 需要 这 个 指针 接收 器 的 函数 。 我 们 在 这 里 
打破 了 这 个 约定 只 是 为 了 展示 一 下 两 种 方法 的 异同 而 已 。 


只 有 类 型 (Point) 和 指向 他 们 的 指针 (*Point)， 才 是 可 能 会 出 现在 接收 器 声明 里 的 两 种 接收 器 。 
此 外 ， 为 了 避免 歧义 ， 在 声明 方法 时 ， 如 果 一 个 类 型 名 本 身 是 一 个 指针 的 话 ， 是 不 允许 其 出 
现在 接收 器 中 的 ， 比 如 下 面 这 个 例子 : 


type P *int 
func (PR) FO 4 7* =.. *7 } 7/7 compile error: anvalad receivern type 


想 要 调用 指针 类 型 方法 (*Point).Sscalepy ， 只 要 提供 一 个 Point 类 型 的 指针 即 可 ， 像 下 面 这 
样 。 


r := &Point{i, 2} 
r.ScaleBy(2) 
fmt.Printin(*r) // "{2, 4}" 


或 者 这 样 : 


p := Point{i, 2} 

pptr := &p 

pptr.ScaleBy(2) 
fmt.Printlin(p) // "{2, 4}" 


或 者 这 样 : 


p := Point{i, 2} 
(&p) .ScaleBy(2) 
fmt.Printlin(p) // "{2, 4}" 


不 过 后 面 两 种 方法 有 些 策 抽 。 幸 运 的 是 ，go 语 言 本 身 在 这 种 地 方 会 帮 到 我 们 。 如 果 接 收 器 p 是 
一 个 Point 类 型 的 变量 ， 并 且 其 方法 需要 一 个 Point 指 针 作 为 接收 器 ， 我 们 可 以 用 下 面 这 种 简短 
的 写法 : 


p.ScaleBy(2) 
编译 器 会 隐 式 地 帮 我 们 用 &p 去 调用 ScaleBy 这 个 方法 。 这 种 简写 方法 只 适用 于 “变量 "， 包 括 


struct 里 的 字段 比如 p.X， 以 及 array 和 slice 内 的 元 素 比 如 perim[0]。 我 们 不 能 通过 一 个 无 法 取 到 
地 址 的 接收 器 来 调用 指针 方法 ， 比 如 临时 变量 的 内 存 地 址 就 无 法 获取 得 到 : 


Point{1, 2}.ScaleBy(2) // compile error: can't take address of Point literal 
但 是 我 们 可 以 用 一 个 *point 这 样 的 接收 器 来 调用 Point 的 方法 ， 因 为 我 们 可 以 通过 地 址 来 找到 


这 个 变量 ， 只 要 用 解 引 用 符号 * 来 取 到 该 变量 即 可 。 编 译 器 在 这 里 也 会 给 我 们 隐 式 地 插 
入 * 这 个 操作 符 ， 所 以 下 面 这 两 种 写法 等 价 的 : 


pptr.Distance(q) 
(*pptr) .Distance(q) 


这 里 的 几 个 例子 可 能 让 你 有 些 困 或 ， 所 以 我 们 总 结 一 下 : 在 每 一 个 合法 的 方法 调用 表达 式 
中 ， 也 就 是 下 面 三 种 情况 里 的 任意 一 种 情况 都 是 可 以 的 : 


不 论 是 接收 器 的 实际 参数 和 其 接收 器 的 形式 参数 相同 ， 比 如 两 者 都 是 类 型 T 或 者 都 是 类 


型 q : 


Point{i, 2}.Distance(q) // Point 
pptr.ScaleBy(2) (jie PoE 


或 者 接收 器 形 参 是 类 型 T， 但 接收 器 实 参 是 类 型 *T ， 这 种 情况 下 编译 器 会 隐 式 地 为 我 们 取 变 
量 的 地 址 : 


p.ScaleBy(2) // implicit (&p) 


或 者 接收 器 形 参 是 类 型 *T ， 实 参 是 类 型 T。 编 译 器 会 隐 式 地 为 我 们 解 引 用 ， 取 到 指针 指向 的 


实际 变量 : 


pptr.Distance(q) // implicit (*pptr) 


如 果 类 型 T 的 所 有 方法 都 是 用 T 类 型 自己 来 做 接收 器 (而 不 是 *T )， 那 么 找 贝 这 种 类 型 的 实例 就 
是 安全 的 ; 调用 他 的 任何 一 个 方法 也 就 会 产生 一 个 值 的 拷贝 。 比 如 time.Duration 的 这 个 类 

型 ， 在 调用 其 方法 时 就 会 被 全 部 拷贝 一 份 ， 包 括 在 作为 参数 传 入 函数 的 时 候 。 但 是 如 果 一 个 

方法 使 用 指针 作为 接收 器 ， 你 需要 避免 对 其 进行 拷贝 ， 因 为 这 样 可 能 会 破坏 掉 该 类 型 内 部 的 

不 变性 。 比 如 你 对 bytes.Buffer 对 象 进行 了 拷贝 ， 那 么 可 能 会 引起 原始 对 象 和 找 贝 对 象 只 是 别 
名 而 已 ， 但 实际 上 其 指向 的 对 象 是 一 致 的 。 紧 接着 对 拷贝 后 的 变量 进行 修改 可 能 会 有 让 你 意 

外 的 结果 。 


译注 ; 作者 这 里 说 的 比较 绕 ， 其 实 有 两 点 : 


1 不管 你 的 method 的 receiver 是 指针 类 型 还 是 非 指针 类 型 ， 都 是 可 以 通过 指针 / 非 指针 类 型 
进行 调用 的 ， 编 译 器 会 帮 你 做 类 型 转换 。 

2. 在 声明 一 个 method 的 receiver 该 是 指针 还 是 非 指针 类 型 时 ， 你 需要 考虑 两 方面 的 内 部 ， 第 
一 方面 是 这 个 对 象 本 身 是 不 是 特别 大 ， 如 果 声 明 为 非 指针 变量 时 ， 调 用 会 产生 一 次 找 
Ns 第 二 方面 是 如 果 你 用 指针 类 型 作为 receiver， 那 么 你 一 定 要 注意 ， 这 种 指针 类 型 指向 
的 始终 是 一 块 内 存 地 址 ， 就 算 你 对 其 进行 了 拷贝 。 熟 悉 C 或 者 C+# 的 人 这 里 应 该 很 快 能 明 
白 。 


6.2.1. Nil 也 是 一 个 合法 的 接收 器 类 型 

就 像 一 些 函 数 允 许 nil 指 针 作 为 参数 一 样 ， 方 法 理论 上 也 可 以 用 nil 指 针 作 为 其 接收 器 ， 尤 其 当 
nil 对 于 对 象 来 说 是 合法 的 零 值 时 ， 比 如 map 或 者 slice。 在 下 面 的 简单 int 链 表 的 例子 里 ，nil 代 
表 的 是 空 链表 : 


// An IntList is a linked list of integers. 


// A nil *IntList represents the empty list. 
type IntList struct { 
Value int 


Tail *IntList 
} 
// Sum returns the sum of the list elements. 
func (list *IntList) Sum() int { 
if list == nil { 
return 0 


} 


return list.Value + list.Tail.Sum() 


你 定义 一 个 允许 nil 作 为 接收 器 值 的 方法 的 类 型 时 ， 在 类 型 前 面 的 注释 中 指出 nil 变 量 代表 的 
是 很 有 必要 的 ， 就 像 我 们 上 面 例子 里 做 的 这 样 。 


当 
ws 


义 
下 面 是 net/url 包 里 Values 类 型 定义 的 一 部 分 。 


net/url 


package url 


// Values maps a string key to a list of values. 
type Values map[string][]string 
// Get returns the first value associated with the given key, 
/bor af there are’ none’. 
func (v Values) Get(key string) string { 
if vs := v[ key]; len(vs) > 0 { 
return vs[0] 


} 


return "" 


} 
// Add adds the value to key. 


// It appends to any existing values associated with key. 
func (v Values) Add(key, value string) { 
v[key] = append(v[key], value) 


这 个 定义 向 外 部 暴露 了 一 个 map 的 类 型 的 变量 ， 并 且 提 供 了 一 些 能 够 简单 操作 这 个 map 的 方 
法 。 这 个 map 的 value 字 段 是 一 个 string 的 slice， 所 以 这 个 Values 是 一 个 多 维 map。 客户 端 使 用 
这 个 变量 的 时 候 可 以 使 用 map 固 有 的 一 些 操 作 (make， 切 片 ，m[key] 等 等 )， 也 可 以 使 用 这 里 
提供 的 操作 方法 ， 或 者 两 者 并 用 ， 都 是 可 以 的 : 


gopl.io/ch6/urlvalues 


m := url.Values{"lang": {"en"}} // direct construction 
m.Add("item", "1") 
m.Add("item", "2") 


fmt.Println(m.Get("lang")) // "en" 
fmt .Println(m.Get("q")) ap Be 


fmt.Println(m.Get("item")) // "1" (first value) 

fmt .Printin(m["item"]) /eet map saccess)) 

m = nil 

fmt.Println(m.Get("item")) // "" 

m.Add("item", "3") // panic: assignment to entry in nil map 


对 Get 的 最 后 一 次 调用 中 ，nil 接 收 器 的 行为 即 是 一 个 空 map 的 行为 。 我 们 可 以 等 价 地 将 这 个 操 
作 写 成 Value(nil).Get("item")， 但 是 如 果 你 直接 写 nil.Get("item") 的 话 是 无 法 通过 编译 的 ， 因 为 

nil 的 字面 量 编译 器 无 法 判断 其 准备 类 型 。 所 以 相 比 之 下 ， 最 后 的 那 行 m.Add 的 调用 就 会 产生 一 
个 panic， 因 为 他 尝试 更 新 一 个 空 map。 


由 于 url.Values 是 一 个 map 类 型 ， 并 且 间 接 引 用 了 其 key/value 对 ， 因 此 url.Values.Add 对 这 个 
map 里 的 元 素 做 任何 的 更 新 、 删 除 操作 对 调用 方 都 是 可 见 的 。 实 际 上 ， 就 像 在 普通 函数 中 一 
样 ， 虽 然 可 以 通过 引用 来 操作 内 部 值 ， 但 在 方法 想 要 修改 引用 本 身 是 不 会 影响 原始 值 的 ， 比 


如 把 他 置 为 nil， 或 者 让 这 个 引用 指向 了 其 它 的 对 象 ， 调 用 方 都 不 会 受 影响 。 (译注 : AA 


入 的 是 存储 了 内 存 地 址 的 变量 ， 你 改变 这 个 变量 是 影响 不 了 原始 的 变量 的 ， 想 想 C 语 言 ， 是 差 


不 多 的 ) 


6.3. A iA EART RAG 


来 看 看 ColoredPoint 这 个 类 型 : 
gopl.io/ch6/coloredpoint 


import "image/color" 
type Point struct{ X, Y float6é4 } 


type ColoredPoint struct { 
Point 
Color color .RGBA 


我 们 完全 可 以 将 ColoredPoint 定 义 为 一 个 有 三 个 字段 的 struct， 但 是 我 们 却 将 Point 这 个 类 型 谨 
入 到 ColoredPoint 来 提供 X 和 Y 这 两 个 字段 。 像 我 们 在 4.4 节 中 看 到 的 那样 ， 内 诅 可 以 使 我 们 在 
定义 ColoredPoint 时 得 到 一 种 名 法 上 的 简写 形式 ， 并 使 其 包含 Point 类 型 所 具有 的 一 切 字 段 ， 
然后 再 定义 一 些 自己 的 。 如 果 我 们 想 要 的 话 ， 我 们 可 以 直接 认为 通过 散 入 的 字段 就 是 
ColoredPoint 自 身 的 字段 ， 而 完全 不 需要 在 调用 时 指出 Point， 比 如 下 面 这 样 。 


var cp ColoredPoint 

cp.X = 1 
fmt.Println(cp.Point.X) // "i" 
cp.Point.Y = 2 
fmt.Println(cp.Y) // "2" 


对 于 Point 中 的 方法 我 们 也 有 类 似 的 用 法 ， 我 们 可 以 把 ColoredPoint 类 型 当 作 接收 器 来 调用 
Point 里 的 方法 ， 即 使 ColoredPoint 里 没有 声明 这 些 方 法 : 


red := color.RGBA{255, 0, 0, 255} 

blue := color.RGBA{O, 0, 255, 255} 

var p = ColoredPoint{Point{i, i}, red} 
var q = ColoredPoint{Point{5, 4}, blue} 
fmt.Println(p.Distance(q.Point)) // "5" 
p.ScaleBy(2) 

q.ScaleBy(2) 
fmt.Println(p.Distance(q.Point)) // "10" 


Point 类 的 方法 也 被 引入 了 ColoredPoint。 用 这 种 方式 ， 内 寿 可 以 使 我 们 定义 字段 特别 多 的 复 
杂 类 型 ， 我 们 可 以 将 字段 先 按 小 类 型 分 组 ， 然 后 定义 小 类 型 的 方法 ， 之 后 再 把 它们 组 合 起 


读者 如 果 对 基于 类 来 实现 面向 对 象 的 语言 比较 熟悉 的 话 ， 可 能 会 倾向 于 将 Point 看 作 一 个 基 
类 ， 而 ColoredPoint 看 作 其 子 类 或 者 继承 类 ， 或 者 将 ColoredPoint 看 作 "is a" Point 类 型 。 但 这 
是 错误 的 理解 。 请 注意 上 面 例子 中 对 Distance 方 法 的 调用 。Distance 有 一 个 参数 是 Point 类 

型 ， 但 q 并 不 是 一 个 Point 类 ， 所 以 尽管 q 有 着 Point 这 个 内 诅 类 型 ， 我 们 也 必须 要 显 式 地 选择 
它 。 尝 试 直接 传 q 的 话 你 会 看 到 下 面 这 样 的 错误 : 


p.Distance(q) // compile error: cannot use q (ColoredPoint) as Point 


一 个 ColoredPoint 并 不 是 一 个 Point， 但 他 "has a"Point， 并 且 它 有 从 Point 类 里 引入 的 Distance 
和 ScaleBy 方 法 。 如 果 你 喜欢 从 实现 的 角度 来 考虑 问题 ， 内 诅 字 段 会 指导 编译 器 去 生成 额外 的 
包装 方法 来 委托 已 经 声明 好 的 方法 ， 和 下 面 的 形式 是 等 价 的 : 


func (p ColoredPoint) Distance(q Point) float64 { 
return p.Point.Distance(q) 


} 


func (p *ColoredPoint) ScaleBy(factor float64) { 
p.Point.ScaleBy( factor) 


} 


当 Point.Distance 被 第 一 个 包装 方法 调用 时 ， 它 的 接收 器 值 是 p.Point， 而 不 是 p， 当 然 了 ， 在 
Point 类 的 方法 里 ， 你 是 访问 不 到 ColoredPoint 的 任何 字段 的 。 


在 类 型 中 内 嵌 的 匿名 字段 也 可 能 是 一 个 命名 类 型 的 指针 ， 这 种 情况 下 字段 和 方法 会 被 间接 地 
引入 到 当前 的 类 型 中 (译注 : 访问 需要 通过 该 指针 指向 的 对 象 去 取 )。 添 加 这 一 层 间 接 关 系 让 我 
们 可 以 共享 通用 的 结构 并 动态 地 改变 对 象 之 间 的 关系 。 下 面 这 个 ColoredPoint 的 声明 内 嵌 了 一 
个 *Point 的 指针 。 


type ColoredPoint struct { 
*Point 
Color color .RGBA 


p := ColoredPoint{&Point{i, i}, red} 

q := ColoredPoint{&Point{5, 4}, blue} 
fmt.Println(p.Distance(*q.Point)) // "5" 

q.Point = p.Point // p and q now share the same Point 
p.ScaleBy(2) 

fmt.Println(*p.Point, *q.Point) // "{2 2} {2 2}" 


一 个 struct 类 型 也 可 能 会 有 多 个 匿名 字段 。 我 们 将 ColoredPoint 定 义 为 下 面 这 样 : 


type ColoredPoint struct { 
Point 
color . RGBA 


然后 这 种 类 型 的 值 便 会 拥有 Point 和 RGBA 类 型 的 所 有 方法 ， 以 及 直接 定义 在 ColoredPoint 中 的 
方法 。 当 编译 器 解析 一 个 选择 器 到 方法 时 ， 比 如 p.ScaleBy， 它 会 首先 去 找 直接 定义 在 这 个 类 
型 里 的 ScaleBy 方 法 ， 然 后 找 被 ColoredPoint 的 内 餐 字 段 们 引入 的 方法 ， 然 后 去 找 Point 和 
RGBA 的 内 奉 字 段 引 入 的 方法 ， 然 后 一 直 递 归 向 下 找 。 如 果 选 择 器 有 二 义 性 的 话 编译 器 会 报 
错 ， 比 如 你 在 同一 级 里 有 两 个 同名 的 方法 。 


方法 只 能 在 命名 类 型 ( 像 Point) 或 者 指向 类 型 的 指针 上 定义 ， 但 是 多 亏 了 内 具 ， 有 些 时 候 我 们 
给 匿名 struct 类 型 来 定义 方法 也 有 了 手段 。 


下 面 是 一 个 小 trick。 这 个 例子 展示 了 简单 的 cache， 其 使 用 两 个 包 级 别 的 变量 来 实现 ， 一 个 
mutex 互 不 量 (§9.2) 和 它 所 操作 的 cache : 


var ( 
mu sync.Mutex // guards mapping 
mapping = make(map[string]string) 


) 


func Lookup(key string) string { 
mu.Lock() 
v := mapping[key] 
mu.Unlock() 
FeCURM sy: 


下 面 这 个 版 本 在 功能 上 是 一 致 的 ， 但 将 两 个 包 级 吧 的 变量 放 在 了 cache 这 个 struct 一 组 内 : 


var cache = struct { 
sync.Mutex 
mapping map[string]string 
Jal 


mapping: make(map[string]string), 


func Lookup(key string) string { 
cache. Lock() 
v := cache.mapping[key] 
cache.Unlock() 
return v 


我 们 给 新 的 变量 起 了 一 个 更 具 表 达 性 的 名 字 cache o Al A sync.Mutex F FX 24 HK AK AF] 了 这 个 
struct 里 ， 其 Lock 和 Unlock 方 法 也 就 都 被 引入 到 了 这 个 匿名 结构 中 了 ， 这 让 我 们 能 够 以 一 个 简 
单 明 了 的 语法 来 对 其 进行 加 锁 解 锁 操作 。 


6.4. 方法 值 和 方法 表达 式 


我 们 经 常 选择 一 个 方法 ， 并 且 在 同一 个 表达 式 里 执行 ， 比 如 常见 的 p.Distance() 形 式 ， 实 际 上 
将 其 分 成 两 步 来 执行 也 是 可 能 的 。p.Distance 叫 作 “ 选 择 器 *， 选 择 器 会 返回 一 个 方法 " 值 "-> 一 
个 将 方法 (Point.Distance) 绑 定 到 特定 接收 器 变量 的 函数 。 这 个 函数 可 以 不 通过 指定 其 接收 器 
即 可 被 调用 ; 即 调用 时 不 需要 指定 接收 器 (译注 : 因为 已 经 在 前 文中 指定 过 了 )， 只 要 传 入 函数 
的 参数 即 可 : 


p := Point{i, 2} 
q := Point{4, 6} 


distanceFromP := p.Distance // method value 

fmt .Println(distanceFromP(q) ) Mf ay 

var origin Point // {0, O} 
fmt.Println(distanceFromP(origin)) // "2.23606797749979", sqrt(5) 


scaleP := p.ScaleBy // method value 


scaleP(2) // p becomes (2, 4) 
scaleP(3) // then (6, 12) 
ScaleP(10) // then (60, 120) 


在 一 个 包 的 API 需 要 一 个 函数 值 、 且 调用 方 希望 操作 的 是 某 一 个 绑 定 了 对 象 的 方法 的 话 ， 方 
法 " 值 " 会 非常 实用 (=_ 绕 )。 举 例 来 说 ， 下 面 例子 中 的 time.AfterFunc 这 个 函数 的 功能 是 在 
指定 的 延迟 时 间 之 后 来 执行 一 个 (译注 : 另外 的 ) 元 数 。 且 这 个 函数 操作 的 是 一 个 Rocket 对 象 r 


ll 
Jes 
A 


type Rocket struct { /* ... */ } 

func (r *Rocket) Launch() { /* ... */ } 

r := new(Rocket) 

time.AfterFunc(i0 * time.Second, func() { r.Launch() }) 


直接 用 方法 " 值 " 传 入 AfterFunc 的 话 可 以 更 为 简短 : 


time.AfterFunc(10 * time.Second, r.Launch) 


译注 : 省 掉 了 上 面 那个 例子 里 的 匿名 元 数 。 


和 方法 " 值 " 相 关 的 还 有 方法 表达 式 。 当 调用 一 个 方法 时 ， 与 调用 一 个 普通 的 函数 相 比 ， 我 们 必 
须要 用 选择 器 (p.Distance) 语 法 来 指定 方法 的 接收 器 。 


当 T 是 一 个 类 型 时 ， 方 法 表达 式 可 能 会 写作 Tf 或 者 (*T).f， 会 返回 一 个 函数 " 值 "， 这 种 函数 会 将 
其 第 一 个 参数 用 作 接 收 器 ， 所 以 可 以 用 通常 (译注 : 不 写 选择 器 ) 的 方式 来 对 其 进行 调用 : 


p := Point{i, 2} 
q := Point{4, 6} 
distance := Point.Distance // method expression 


fmt.Println(distance(p, q)) // "5" 
fmt .Printf("%T\n", distance) // "func(Point, Point) float64" 


scale := (*Point).ScaleBy 

scale(&p, 2) 

fmt.Println(p) Ll OA 
fmt.Printf("%T\n", scale) // "func(*Point, float64)" 


L 


I EEE a a un (p Point) Distance() ° 






A 函数 需要 比 实际 的 Distance 方 法 多 一 个 参数 ， 
// 即 其 个 额外 参 F 列 Distance 方 法 的 参数 
// 看 起 x 本 书 中 有 函数 和 方法 的 区 别 是 指 有 没有 接收 器 ， 而 不 像 其 他 语言 那样 是 指 有 没有 返回 值 。 


你 根据 一 个 变量 来 决定 调用 同一 个 类 型 的 哪个 函数 时 ， 方 法 表达 式 就 显得 很 有 用 了 。 你 可 
ee 先 择 来 调用 接收 器 各 不 相同 的 方法 。 下 面 的 例子 ， 变 量 op 代 表 Point 类 型 的 addition 或 者 
subtraction 方 法 ，Path.TranslateBy 方 法 会 为 其 Path 数 组 中 的 每 一 个 Point 来 调用 对 应 的 方法 : 


type Point struct{ X，Y float64 } 


func (p Point) Add(q Point) Point { return Point{p.X + q.X, p.Y + q.Y} } 
func (p Point) Sub(q Point) Point { return Point{p.X - q.X, p.Y - q.Y} } 


type Path []Point 


func (path Path) TranslateBy(offset Point, add bool) { 
var op func(p, q Point) Point 


if add 

op = Point.Add 
} else { 

op = Point.Sub 
} 


for i := range path { 
// Call either path[i].Add(offset) or path[i].Sub(offset). 
path[i] = op(path[i], offset) 


6.5. 示例 : Bit 数 组 


Go 语言 里 的 集合 一 般 会 用 map[Tjbool 这 种 形式 来 表示 ，T 代 表 元 素 类 型 。 集 合用 map 类 型 来 表 
示 虽 然 非常 灵活 ， 但 我 们 可 以 以 一 种 更 好 的 形式 来 表示 它 。 例 如 在 数据 流 分 析 领 域 ， 集 合 元 
素 通常 是 一 个 非 负 整 数 ， 集 合 会 包含 很 多 元 素 ， 并 且 集 合 会 经 常 进行 并 集 、 交 集 操作 ， 这 种 
情况 下 ，bit 数 组 会 比 map 表 现 更 加 理想 。( 译 注 : 这 里 再 补充 一 个 例子 ， 比 如 我 们 执行 一 个 
http 下 载 任 务 ， 把 文件 按照 16kb 一 块 划 分 为 很 多 块 ， 需 要 有 一 个 全 局 变量 来 标识 哪些 块 下 载 完 
成 了 ， 这 种 时 候 也 需要 用 到 bit 数 组 ) 


一 个 bit 数 组 通常 会 用 一 个 无 符号 数 或 者 称 之 为 “ 字 ” 的 slice 或 者 来 表示 ， 每 一 个 元 素 的 每 一 位 都 
表示 集合 里 的 一 个 值 。 当 集合 的 第 位 被 设置 时 ， 我 们 才 说 这 个 集合 包含 元 素 i。 下 面 的 这 个 程 
序 展 示 了 一 个 简单 的 bit 数 组 类 型 ， 并 且 实 现 了 三 个 函数 来 对 这 个 bit 数 组 来 进行 操作 : 


gopl.io/ch6/intset 


// An IntSet is a set of small non-negative integers. 
// Its zero value represents the empty set. 
type IntSet struct { 

words []uint64 


// Has reports whether the set contains the non-negative value x. 
func (s *IntSet) Has(x int) bool { 

word, bit := x/64, uint(x%64) 

return word < len(s.words) && s.words[word]&(i<<bit) != 0 


// Add adds the non-negative value x to the set. 
func (s *IntSet) Add(x int) { 
word, bit := x/64, uint(x%64) 
for word >= len(s.words) { 
s.words = append(s.words, 0) 


} 


s.words[word] |= 1 << bit 


// Unionwith sets s to the union of s and t. 
func (s *IntSet) Unionwith(t *IntSet) { 
for i, tword := range t.words { 
if i < len(s.words) { 
s.words[i] |= tword 
y else { 
s.words = append(s.words, tword) 


因为 每 一 个 字 都 有 64 个 二 进 制 位 ， 所 以 为 了 定位 x 的 bit 位 ， 我 们 用 了 x/64 的 商 作为 字 的 下 标 ， 
并 且 用 x%64 得 到 的 值 作 为 这 个 字 内 的 bit 的 所 在 位 置 。UnionWith 这 个 方法 里 用 到 了 bit 位 

的 “或 ?逻辑 操作 符号 | 来 一 次 完成 64 个 元 素 的 或 计算 。( 在 练习 6.5 中 我 们 还 会 程序 用 到 这 个 64 位 
字 的 例子 。) 


当前 这 个 实现 还 缺少 了 很 多 必要 的 特性 ， 我 们 把 其 中 一 些 作 为 练习 题 列 在 本 小 节 之 后 。 但 是 
有 一 个 方法 如 果 缺 失 的 话 我 们 的 bit 数 组 可 能 会 比较 难 混 : 将 IntSet 作 为 一 个 字符 串 来 打印 。 这 
里 我 们 来 实现 它 ， 让 我 们 来 给 上 面 的 例子 添加 一 个 String 方 法 ， 类 似 2.5 节 中 做 的 那样 : 


// Strang returns the set as a string of the form “ft 2 3)": 
func (s *IntSet) String() string { 

var buf bytes.Buffer 

buf.WriteByte('{') 


for i, word := range s.words { 
if word == 0 { 
continue 
} 


for j := 0; j < 64; jtt+ { 
if word&(i<<uint(j)) != 0 { 
if buf.Len() > len("{") { 
buf .WriteByte('}') 


} 
fmt .Fprintf(&buf, "%d", 64*i+j) 


} 


} 
buf .writeByte('}') 
return buf.String() 


这 里 留意 一 下 String 方 法 ， 是 不 是 和 3.5.4 节 中 的 intsToString 方 法 很 相似 ; bytes.Buffer 在 
String 方 法 里 经 常 这 么 用 。 当 你 为 一 个 复杂 的 类 型 定义 了 一 个 String 方 法 时 ，fmt 包 就 会 特殊 对 
待 这 种 类 型 的 值 ， 这 样 可 以 让 这 些 类 型 在 打印 的 时 候 看 起 来 更 加 友好 ， 而 不 是 直接 打印 其 原 
始 的 值 。fmt 会 直接 调用 用 户 定义 的 String 方 法 。 这 种 机 制 依赖 于 接口 和 类 型 断言 ， 在 第 7 章 中 
我 们 会 详细 介绍 。 


现在 我 们 就 可 以 在 实战 中 直接 用 上 面 定义 好 的 IntSet 了 : 


var x, y IntSet 

x.Add(1) 

x.Add(144) 

x.Add(9) 

fmt.Println(x.String()) // "{1 9 144}" 


y .Add(9) 
y .Add(42) 
fmt.Printlin(y.String()) // "{9 42}" 


x.Unionwith(&y) 
fmt.Println(x.String()) // "{1 9 42 144}" 
fmt.Println(x.Has(9), x.Has(123)) // "true false" 


这 里 要 注意 : 我 们 声明 的 String 和 Has 两 个 方法 都 是 以 指针 类 型 *IntSet 来 作为 接收 器 的 ， 但 实 
际 上 对 于 这 两 个 类 型 来 说 ， 把 接收 器 声明 为 指针 类 型 也 没什么 必要 。 不 过 另外 两 个 函数 就 不 
是 这 样 了 ， 因 为 另外 两 个 函数 操作 的 是 s.Words 对 象 ， 如 果 你 不 把 接收 器 声明 为 指针 对 象 ， 那 
么 实际 操作 的 是 拷贝 对 象 ， 而 不 是 原来 的 那个 对 象 。 因 此 ， 因 为 我 们 的 String 方 法 定义 在 
IntSet 指 针 上 ， 所 以 当 我 们 的 变量 是 IntSet 类 型 而 不 是 IntSet 指 针 时 ， 可 能 会 有 下 面 这 样 让 人 意 
外 的 情况 : 


fmt .Println(&x) VO aed A440 
fmt.Println(x.String()) // "{1 9 42 144}" 
fmt.Println(x) // "{[4398046511618 0 65536]}" 


在 第 一 个 PrintIn 中 ， 我 们 打印 一 个 *IntSet 的 指针 ， 这 个 类 型 的 指针 确实 有 自 定义 的 String 方 
法 。 第 二 PrintlIn， 我 们 直接 调用 了 x 变量 的 String() 方 法 ; 这 种 情况 下 编译 器 会 隐 式 地 在 x 前 插 
入 & 操 作 符 ， 这 样 相当 远 我 们 还 是 调用 的 IntSet 指 针 的 String 方 法 。 在 第 三 个 PrintIn 中 ， 因 为 
IntSet 类 型 没有 String 方 法 ， 所 以 Println 方 法 会 直接 以 原始 的 方式 理解 并 打印 。 所 以 在 这 种 情 
况 下 & 符 号 是 不 能 忘 的 。 在 我 们 这 种 场景 下 ， 你 把 String 方 法 绑 定 到 IntSet 对 象 上 ， 而 不 是 
IntSet 指 针 上 可 能 会 更 合适 一 些 ， 不 过 这 也 需要 具体 问题 具体 分 析 。 
练习 6.1: 为 bit 数 组 实现 下 面 这 些 方法 

func (*IntSet) Len() int // return the number of elements 

func (*IntSet) Remove(x int) // remove x from the set 


func (*IntSet) Clear() // remove all elements from the set 
func (*IntSet) Copy() *IntSet // return a copy of the set 


练习 6.2 : 定义 一 个 变 参 方法 (*IntSet).AddAll(...int)， 这 个 方法 可 以 为 一 组 IntSet 值 求 和 ， 比 如 
s.AddAll(1,2,3) 。 


练习 6.3: (*IntSet).UnionWith 会 用 | 操作 符 计算 两 个 集合 的 交集 ， 我 们 再 为 IntSet 实 现 另 外 的 
几 个 函数 IntersectWith( 交 集 : 元 素 在 人 集合 BB 集合 均 出 现 ),DifferenceWith( 差 集 : 元 素 出 现在 A 
集合 ， 未 出 现在 B 集 合 ),SymmetricDifference( 并 差 集 : 元 素 出 现在 A 但 没有 出 现在 B， 或 者 出 
现在 B 没 有 出 现在 A)。 练习 6.4: 实现 一 个 Elems 方 法 ， 返 回 集合 中 的 所 有 元 素 ， 用 于 做 一 些 
range 之 类 的 遍历 操作 。 


练习 6.5 : 我 们 这 章 定义 的 IntSet 里 的 每 个 字 都 是 用 的 uint64 类 型 ， 但 是 64 位 的 数值 可 能 在 32 
位 的 平台 上 不 高 效 。 修 改 程序 ， 使 其 使 用 uint 类 型 ， 这 种 类 型 对 于 32 位 平台 来 说 更 合适 。 当 然 
了 ， 这 里 我 们 可 以 不 用 简单 粗暴 地 除 64， 可 以 定义 一 个 常量 来 决定 是 用 32 还 是 64， 这 里 你 可 
能 会 用 到 平台 的 自动 判断 的 一 个 智能 表达 式 : 32 << (^uint(0) >> 63) 


6.6. 封装 


一 个 对 象 的 变量 或 者 方法 如 果 对 调用 方 是 不 可 见 的 话 ， 一 般 就 被 定义 为 封装"。 封 装 有 时 候 也 
被 叫做 信息 隐藏 ， 同 时 也 是 面向 对 象 编程 最 关键 的 一 个 方面 。 


Go 语言 只 有 一 种 控制 可 见 性 的 手段 : 大 写 首 字母 的 标识 符 会 从 定义 它们 的 包 中 被 导出 ， 小 写 
字母 的 则 不 会 。 这 种 限制 包 内 成 员 的 方式 同样 适用 于 struct 或 者 一 个 类 型 的 方法 。 因 而 如 果 我 
们 想 要 封装 一 个 对 象 ， 我 们 必须 将 其 定义 为 一 个 struct 。 


这 也 就 是 前 面 的 小 节 中 IntSet 被 定义 为 struct 类 型 的 原因 ， 尽 管 它 只 有 一 个 字段 : 


type IntSet struct { 
words []uint64 
} 


当然 ， 我 们 也 可 以 把 IntSet 定 义 为 一 个 slice 类 型 ， 尽 管 这 样 我 们 就 需要 把 代码 中 所 有 方法 里 用 
到 的 s.words 用 *s 替 换 掉 了 : 


type IntSet []uint64 


尽管 这 个 版 本 的 IntSet 在 本 质 上 是 一 样 的 ， 他 也 可 以 允许 其 它 包 中 可 以 直接 读 取 并 编辑 这 个 
slice。 换 名 话说 ， 相 对 *S 这 个 表达 式 会 出 现在 所 有 的 包 中 ，s.words 只 需要 在 定义 IntSet 的 包 
中 出 现 (译注 : 所 以 还 是 推荐 后 者 吧 的 意思 )。 


这 种 基于 名 字 的 手段 使 得 在 语言 中 最 小 的 封装 单元 是 package， 而 不 是 像 其 它 语言 一 样 的 类 
型 。 一 个 struct 类 型 的 字段 对 同一 个 包 的 所 有 代码 都 有 可 见 性 ， 无 论 你 的 代码 是 写 在 一 个 函数 
还 是 一 个 方法 里 。 


封装 提供 了 三 方面 的 优点 。 首 先 ， 因 为 调用 方 不 能 直接 修改 对 象 的 变量 值 ， 其 只 需要 关注 少 
量 的 语句 并 且 只 要 弄 懂 少量 变量 的 可 能 的 值 即 可 。 


第 二 ， 隐 藏 实现 的 细节 ， 可 以 防止 调用 方 依赖 那些 可 能 变化 的 具体 实现 ， 这 样 使 设计 包 的 程 
序 员 在 不 破坏 对 外 的 api 情 况 下 能 得 到 更 大 的 自由 。 


把 bytes.Buffer 这 个 类 型 作为 例子 来 考虑 。 这 个 类 型 在 做 短 字 符 串 壹 加 的 时 候 很 常用 ， 所 以 在 
设计 的 时 候 可 以 做 一 些 预先 的 优化 ， 比 如 提前 预 留 一 部 分 空间 ， 来 避免 反复 的 内 存 分 配 。 又 
因为 Buffer 是 一 个 struct 类 型 ， 这 些 额 外 的 空间 可 以 用 附加 的 字 节 数组 来 保存 ， 且 放 在 一 个 小 
写字 母 开 头 的 字段 中 。 这 样 在 外 部 的 调用 方 只 能 看 到 性 能 的 提升 ， 但 并 不 会 得 到 这 个 附加 变 
量 。Buffer 和 其 增长 算法 我 们 列 在 这 里 ， 为 了 简洁 性 稍微 做 了 一 些 精简 : 


type Buffer struct { 


buf []byte 
initial [64]byte 
[ee seme 


// Grow expands the buffer's capacity, if necessary, 
// to guarantee space for another n bytes. [...] 
func (b *Buffer) Grow(n int) { 
if b.buf == nil { 
b.buf = b.initial[:0] // use preallocated space initially 
} 
if len(b.buf)+n > cap(b.buf) { 
buf := make([]byte, b.Len(), 2*cap(b.buf) + n) 
copy(buf, b.buf) 
b.buf = buf 


封装 的 第 三 个 优点 也 是 最 重要 的 优点 ， 是 阻止 了 外 部 调用 方 对 对 象 内 部 的 值 任意 地 进行 修 
改 。 因 为 对 象 内 部 变量 只 可 以 被 同一 个 包 内 的 函数 修改 ， 所 以 包 的 作者 可 以 让 这 些 函数 确保 
对 象 内 部 的 一 些 值 的 不 变性 。 比 如 下 面 的 Counter 类 型 允许 调用 方 来 增加 counter 变 量 的 值 ， 并 
且 人 允许 将 这 个 值 reset 为 0， 但 是 不 允许 随便 设置 这 个 值 (译注 : 因为 压根 就 访问 不 到 ) : 


type Counter struct { n int } 

func (c *Counter) N() int { return c.n } 
func (c *Counter) Increment() { c.n++ } 

func (c *Counter) Reset() { c.n = 0 } 


只 用 来 访问 或 修改 内 部 变量 的 函数 被 称 为 setter 或 者 getter， 例 子 如 下 ， 比 如 log 包 里 的 Logger 
类 型 对 应 的 一 些 函 数 。 在 命名 一 个 getter 方 法 时 ， 我 们 通常 会 省 略 掉 前 面 的 Get 前 级 。 这 种 简 
洁 上 的 偏好 也 可 以 推广 到 各 种 类 型 的 前 组 比如 Fetch，Find 或 者 Lookup 。 


package log 

type Logger struct { 
flags int 
prefix string 
HUE Tae 


func (1 *Logger) Flags() int 

func (1 *Logger) SetFlags(flag int) 

func (1 *Logger) Prefix() string 

func (1 *Logger) SetPrefix(prefix string) 


Go 的 编码 风格 不 禁止 直接 导出 字段 。 当 然 ， 一 旦 进行 了 导出 ， 就 没有 办 法 在 保证 AP| 兼 容 的 
情况 下 去 除 对 其 的 导出 ， 所 以 在 一 开始 的 选择 一 定 要 经 过 深思 就 处 并 且 要 考虑 到 包 内 部 的 一 
些 不 变量 的 保证 ， 未 来 可 能 的 变化 ， 以 及 调用 方 的 代码 质量 是 否 会 因为 包 的 一 点 修改 而 变 
Žž o 


封装 并 不 总 是 理想 的 。 虽然 封装 在 有 些 情况 是 必要 的 ， 但 有 时 候 我 们 也 需要 暴露 一 些 内 部 内 
容 ， 比 如 :time.Duration 将 其 表现 暴露 为 一 个 int64 数 字 的 纳 秒 ， 使 得 我 们 可 以 用 一 般 的 数值 
操作 来 对 时 间 进 行 对 比 ， 甚 至 可 以 定义 这 种 类 型 的 常量 : 


const day = 24 * time.Hour 
fmt.Println(day.Seconds()) // "86400" 


另 一 个 例子 ， 将 IntSet 和 本 章 开头 的 geometry.Path 进 行 对 比 。 eas 一 个 slice 类 型 ， 
这 人 允许 其 调用 slice 的 字面 方法 来 对 其 内 部 的 points 用 range 进 行 先 代 遍 历 ; 在 这 一 点 上 ，|ntSet 
是 没有 办 法 让 你 这 么 做 的 。 


这 两 种 类 型 决定 性 的 不 同 : geometry.Path 的 本 质 是 一 个 坐标 点 的 序列 ， 不 多 也 不 少 ， 我 们 可 
以 预见 到 之 后 也 并 不 会 给 他 增加 额外 的 字段 ， 所 以 在 geometry 包 中 将 Path 又 露 为 一 个 slice ° 

相 比 之 下 ，IntSet 仅 仅 是 在 这 里 用 了 一 个 []Juint64 的 slice。 这 个 类 型 还 可 以 用 []uint 类 型 来 表 

示 ， 或 者 我 们 甚至 可 以 用 其 wae 的 占用 更 小 内 存 空间 的 东西 来 表示 这 个 集合 ， 所 以 我 

们 可 能 还 会 需要 额外 的 字段 来 在 这 个 类 型 中 记录 元 素 的 个 数 。 也 正 是 因为 这 些 原因 ， 我 们 让 

IntSet 对 调用 方 透 明 。 


在 这 章 中 ， 我 们 学 到 了 如 何 将 方法 与 命名 类 型 进行 组 合 ， 并 且 知 道 了 如 何 调用 这 些 方 法 。 尽 
管 方法 对 于 OOP 编 程 来 说 至 关 重 要 ， ye A 是 OOP 编 程 里 的 半边 天 。 为 了 完成 OOP， 我 们 
还 需要 接口 。Go 里 的 接口 会 在 下 一 章 中 介绍 。 


第 七 章 接口 


接口 类 型 是 对 其 它 类 型 行为 的 抽象 和 概括 ; 因为 接口 类 型 不 会 和 特定 的 实现 细节 绑 定 在 一 
起 ， 通 过 这 种 抽象 的 方式 我 们 可 以 让 我 们 的 函数 更 加 灵活 和 更 具有 适应 能 力 。 


很 多 面向 对 象 的 语言 都 有 相似 的 接口 概念 ， 但 Go 语言 中 接口 类 型 的 独特 之 处 在 于 它 是 满足 隐 
式 实现 的 。 也 就 是 说 ， 我 们 没有 必要 对 于 给 定 的 具体 类 型 定义 所 有 满足 的 接口 类 型 ; 简单 地 
拥有 一 些 必需 的 方法 就 足够 了 。 这 种 设计 可 以 让 你 创建 一 个 新 的 接口 类 型 满足 已 经 存在 的 具 
体 类 型 却 不 会 去 改变 这 些 类 型 的 定义 ; 当 我 们 使 用 的 类 型 来 自 于 不 受 我 们 控制 的 包 时 这 种 设 
计 尤 其 有 用 。 


在 本 章 ， 我 们 会 开始 看 到 接口 类 型 和 值 的 一 些 基 本 技巧 。 顺 着 这 种 方式 我 们 将 学 习 几 个 来 自 
标准 库 的 重要 接口 。 很 多 Go 程序 中 都 尽 可 能 多 的 去 使 用 标准 库 中 的 接口 。 最 后 ,我 们 会 在 
(S7.10) 看 到 类 型 断言 的 知识 ， 在 (S7.13) 看 到 类 型 开关 的 使 用 并 且 学 到 他 们 是 怎样 让 不 同 的 类 
型 的 概括 成 为 可 能 。 


7.1. 接口 约定 


目前 为 止 ， 我 们 看 到 的 类 型 都 是 具体 的 类 型 。 一 个 具体 的 类 型 可 以 准确 的 描述 它 所 代表 的 值 
并 且 展 示 出 对 类 型 本 身 的 一 些 操作 方式 就 像 数字 类 型 的 算术 操作 ， 切 片 类 型 的 索引 、 附 加 和 
取 范 围 操 作 。 具 体 的 类 型 还 可 以 通过 它 的 方法 提供 额外 的 行为 操作 。 总 的 来 说 ， 当 你 拿 到 一 
个 具体 的 类 型 时 你 就 知道 它 的 本 身 是 什么 和 你 可 以 用 它 来 做 什么 。 


在 Go 语言 中 还 存在 着 另外 一 种 类 型 : 接口 类 型 。 接 口 类 型 是 一 种 抽象 的 类 型 。 它 不 会 暴露 出 
它 所 代表 的 对 象 的 内 部 值 的 结构 和 这 个 对 象 支持 的 基础 操作 的 集合 ; 它们 只 会 展示 出 它们 自 
己 的 方法 。 也 就 是 说 当 你 有 看 到 一 个 接口 类 型 的 值 时 ， 你 不 知道 它 是 什么 ， 唯 一 知道 的 就 是 
可 以 通过 它 的 方法 来 做 什么 。 


在 本 书 中 ， 我 们 一 直 使 用 两 个 相似 的 函数 来 进行 字符 串 的 格式 化 : fmt.Printf 它 会 把 结果 写 到 
标准 输出 和 fmt.Sprintf 它 会 把 结果 以 字符 串 的 形式 返回 。 得 益 于 使 用 接口 ， 我 们 不 必 可 悲 的 因 
为 返回 结果 在 使 用 方式 上 的 一 些 浅显 不 同 就 必需 把 格式 化 这 个 最 困难 的 过 程 复制 一 份 。 实 际 
上 ， 这 两 个 函数 都 使 用 了 另 一 个 函数 fmt.Fprintf 来 进行 封装 。fmt.Fprintf 这 个 函数 对 它 的 计算 
结果 会 被 怎么 使 用 是 完全 不 知道 的 。 


package fmt 


func Fprintf(w io.wWriter, format string, args ...interface{}) (int, error) 
func Printf(format string, args ...interfacef{}) (int, error) { 
return Fprintf(os.Stdout, format, args...) 
} 
func Sprintf(format string, args ...interface{}) string { 
var buf bytes.Buffer 
Fprintf(&buf, format, args...) 
return buf.String() 
} 


Fprintf 的 前 级 F 表 示 文 件 (File) 也 表明 格式 化 输出 结果 应 该 被 写 入 第 一 个 参数 提供 的 文件 中 。 在 
Printf 函 数 中 的 第 一 个 参数 os.Stdout 是 *os.File 类 型 ; 在 Sprintf 函 数 中 的 第 一 个 参数 &buf 是 一 个 
指向 可 以 写 入 字 节 的 内 存 缓冲 区 ， 然 而 它 并 不 是 一 个 文件 类 型 尽管 它 在 某 种 意义 上 和 文件 类 
型 相似 。 


即使 Fprintf 骂 数 中 的 第 一 个 参数 也 不 是 一 个 文件 类 型 。 它 是 io.Writer 类 型 这 是 一 个 接口 类 型 定 
义 如 下 : 


package io 


// Writer is the interface that wraps the basic Write method. 

type Writer interface { 
// Write writes len(p) bytes from p to the underlying data stream. 
// It returns the number of bytes written from p (0 <= n <= len(p)) 
// and any error encountered that caused the write to stop early. 





// Write must return a non-nil error if it returns n < len(p) 
// Write must not modify the slice data, even temporarily. 

Wf 

// Implementations must not retain p. 

Write(p []byte) (n int, err error) 
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供 具 体 类 型 的 值 就 像 *os.File 和 *bytes.Buffer， 这 些 类 型 都 有 一 个 特定 签名 和 行为 的 Write 的 函 
数 。 另 一 方面 这 个 约定 保证 了 Fprintf 接 受 任何 满足 io.Writer 接 口 的 值 都 可 以 工作 。Fprintf 骂 数 
可 能 没有 假定 写 入 的 是 一 个 文件 或 是 一 段 内 存 ， 而 是 写 入 一 个 可 以 调用 Write 元 数 的 值 。 


为 fmt.Fprintf 驶 数 没有 对 具体 操作 的 值 做 任何 假设 而 是 仅仅 通过 io.Writer 接 口 的 约定 来 保证 
行为 ， 所 以 第 一 个 参数 可 以 安全 地 传 入 一 个 任何 具体 类 型 的 值 只 需要 满足 io.Writer 接 口 。 一 个 
类 型 可 以 自由 的 使 用 另 一 个 满足 相同 接口 的 类 型 来 进行 替换 被 称 作 可 替换 性 (LSP 里 色 替 换 )。 
这 是 一 个 面向 对 象 的 特征 。 


让 我 们 通过 一 个 新 的 类 型 来 进行 校 验 ， 下 面 *ByteCounter 类 型 里 的 Write 方 法 ， 仅 仅 在 丢失 写 
向 它 的 字 节 前 统计 它们 的 长 度 。( 在 这 个 += 赋 值 语句 中 ， 让 len(p) 的 类 型 和 *c 的 类 型 匹配 的 转 
换 是 必须 的 。) 


gopl.io/ch7/bytecounter 


type ByteCounter int 


func (c *ByteCounter) Write(p []byte) (int, error) { 
*c += ByteCounter(len(p)) // convert int to ByteCounter 
return len(p), nil 


为 *ByteCounter 满 足 io.Writer 的 约定 ， 我 们 可 以 把 它 传 入 Fprintf 函 数 中 ; Fprintf h Ait F 
符 串 格式 化 的 过 程 不 会 去 关注 ByteCounter 正 确 的 累加 结果 的 长 度 。 


var c ByteCounter 

c.Write([]byte("hello")) 

fmt.Println(c) // "5", = len("hello") 

C 王 三 是 人 // reset the counter 

var name = "Dolly" 

fmt.Fprintf(&c, "hello, %s", name) 
fmt.Printin(c) // "12", = len("hello, Dolly") 


除了 io.Writer 这 个 接口 类 型 ， 还 有 另 一 个 对 fmt 包 很 重要 的 接口 类 型 。Fprintf 和 Fprintln 函数 向 
类 型 提供 了 一 种 控制 它们 值 输出 的 途径 。 在 2.5 节 中 ， 我 们 为 Celsius 类 型 提供 了 一 个 String 方 
法 以 便于 可 以 打印 成 这 样 "100"C" ， 在 6.5 节 中 我 们 给 *lntSet 添 加 一 个 String 方 法 ， 这 样 集合 可 
以 用 传统 的 符号 来 进行 表示 就 像 [(1 2 3}"。 给 一 个 类 型 定义 String 方 法 ， 可 以 让 它 满足 最 广泛 

使 用 之 一 的 接口 类 型 fmt.Stringer : 


package fmt 


// The String method is used to print values passed 
// as an operand to any format that accepts a string 
// or to an unformatted printer such as Print. 
type Stringer interface { 

String() string 
} 


我 们 会 在 7.10 节 解释 fmt 包 怎么 发 现 哪些 值 是 满足 这 个 接口 类 型 的 。 


练习 7.1: 使 用 来 自 ByteCounter 的 思路 ， 实 现 一 个 针对 对 单词 和 行 数 的 计数 器 。 你 会 发 现 
bufio.ScanWords 非 常 的 有 用 。 


练习 7.2 : 写 一 个 带 有 如 下 元 数 签名 的 函数 CountingWriter， 传 入 一 个 io.Writer 接 口 类 型 ， 返 
回 一 个 新 的 Writer 类 型 把 原来 的 Writer 封 装 在 里 面 和 一 个 表示 写 入 新 的 Writer 字 节 数 的 int64 类 
型 指针 


func Countingwriter(w io.Writer) (io.Writer, *int64) 


练习 7.3 : A #gopl.io/ch4/treesort (S4.4) 的 *tree 类 型 实现 一 个 String 方 法 去 展示 tree 类 型 的 值 
序列 o 


7.2. 接口 类 型 


接口 类 型 具体 描述 了 一 系列 方法 的 集合 ， 一 个 实现 了 这 些 方法 的 具体 类 型 是 这 个 接口 类 型 的 
实例 。 


io.Writer 类 型 是 用 的 最 广泛 的 接口 之 一 ， 因 为 它 提供 了 所 有 的 类 型 写 入 bytes 的 抽象 ， 包 括 文 
件 类 型 ， 内 存 缓冲 区 ， 网 络 链接 ，HTTP 客 户 端 ， 压 缩 工 具 ， 哈 希 等 等 。io 包 中 定义 了 很 多 其 
它 有 用 的 接口 类 型 。Reader 可 以 代表 任意 可 以 读 取 bytes 的 类 型 ，Closer 可 以 是 任意 可 以 关闭 
的 值 ， 例 如 一 个 文件 或 是 网 络 链接 。 (到 现在 你 可 能 注意 到 了 很 多 Go 语言 中 单方 法 接口 的 命 
名 习惯 ) 


package io 
type Reader interface { 
Read(p []byte) (n int, err error) 
} 
type Closer interface { 
Close() error 


} 


在 往 下 看 ， 我 们 发 现 有 些 新 的 接口 类 型 通过 组 合 已 经 有 的 接口 来 定义 。 下 面 是 两 个 例子 : 


type ReadWriter interface { 
Reader 
Writer 

} 

type ReadwriteCloser interface { 
Reader 
Writer 
Closer 


上 面 用 到 的 语法 和 结构 内 获 相 似 ， 我 们 可 以 用 这 种 方式 以 一 个 简写 命名 另 一 个 接口 ， 而 不 用 
声明 它 所 有 的 方法 。 这 种 方式 本 称 为 接口 内 获 。 尽 管 略 失 简洁 ， 我 们 可 以 像 下 面 这 样 ， 不 使 
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type Readwriter interface { 
Read(p []byte) (n int, err error) 
Write(p []byte) (n int, err error) 


或 者 甚至 使 用 种 混合 的 风格 : 


type ReadwWriter interface { 
Read(p []byte) (n int, err error) 
Writer 


上 面 3 种 定义 方式 都 是 一 样 的 效果 。 方 法 的 顺序 变化 也 没有 影响 ， 唯 一 重要 的 就 是 这 个 集合 里 
面 的 方法 。 

练习 7.4 : strings.NewReader 函 数 通 过 读 取 一 个 string 参 数 返 回 一 个 满足 jo.Reader 接 口 类 型 
的 值 (和 其 它 值 ) 。 实 现 一 个 简单 版 本 的 NewReader， 并 用 它 来 构造 一 个 接收 字符 串 输 入 的 
HTML 解 析 器 (§5.2) 

练习 7.5 : io 包 里 面 的 LimitReader 部 数 接收 一 个 io.Reader 接 口 类 型 的 r 和 字 节 数 n， 并 且 返 回 
另 一 个 从 r 中 读 取 字 节 但 是 当 读 完 n 个 字 节 后 就 表示 读 到 文件 结束 的 Reader。 实 现 这 个 
LimitReader $% : 


func LimitReader(r io.Reader, n int64) io.Reader 


7.3. 实现 接口 的 条 件 


一 个 类 型 如 果 拥 有 一 个 接口 需要 的 所 有 方法 ， 那 么 这 个 类 型 就 实现 了 这 个 接口 。 例 如 ， 
*os.File 类 型 实现 了 io.Reader，Writer，Closer， 和 ReadWriter 接 口 。*bytes.Buffer 实 现 了 
Reader，Writer， 和 ReadWriter 这 些 接口 ， 但 是 它 没 有 实现 Closer 接 口 因为 它 不 具有 Close 方 
法 。Go 的 程序 员 经 常会 简要 的 把 一 个 具体 的 类 型 描述 成 一 个 特定 的 接口 类 型 。 举 个 例子 ， 
*bytes.Buffer 是 io.Writer ; *os.Files 是 io.ReadWriter ° 


接口 指定 的 规则 非常 简单 : 表达 一 个 类 型 属于 某 个 接口 只 要 这 个 类 型 实现 这 个 接口 。 所 以 : 


var w io.Writer 


w = os.Stdout // OK: *os.File has Write method 
w = new(bytes.Buffer ) // OK: *bytes.Buffer has Write method 
w = time.Second // compile error: time.Duration lacks Write method 


var rwc io.ReadwriteCloser 
rwc = os.Stdout // OK: *os.File has Read, Write, Close methods 
rwc = new(bytes.Buffer) // compile error: *bytes.Buffer lacks Close method 


这 个 规则 甚至 适用 于 等 式 右边 本 身 也 是 一 个 接口 类 型 


w = rwc // OK: i0.ReadwriteCloser has Write method 
rwc = w // compile error: io.Writer lacks Close method 


为 ReadWriter 和 ReadWriteCloser 包 含 所 有 Writer 的 方法 ， 所 以 任何 实现 了 ReadWriter 和 
ReadWriteCloser 的 类 型 必定 也 实现 了 Writer 接 口 


在 进一步 学 习 前 ， 必 须 先 解释 表示 一 个 类 型 持 有 一 个 方法 当中 的 细节 。 回 想 在 6.2 章 中 ， 对 于 
每 一 个 命名 过 的 具体 类 型 T ; 它 一 些 方法 的 接收 者 是 类 型 T 本 身 然而 另 一 些 则 是 一 个 T 的 指针 。 
还 记得 在 T 类 型 的 参数 上 调用 一 个 T 的 方法 是 合法 的 ， 只 要 这 个 参数 是 一 个 变量 ; 编译 器 隐 式 
的 获取 了 它 的 地 址 。 但 这 仅仅 是 一 个 语法 糖 : T 类 型 的 值 不 拥有 所 有 *T 指 针 的 方法 ， 那 这 样 它 
就 可 能 只 实现 更 少 的 接口 。 

举 个 例子 可 能 会 更 清晰 一 点 。 在 第 6.5 章 中 ，IntSet 类 型 的 String 方 法 的 接收 者 是 一 个 指针 类 
型 ， 所 以 我 们 不 能 在 一 个 不 能 寻 址 的 IntSet 值 上 调用 这 个 方法 : 


type IntSet struct { /* ... */ } 
func (*IntSet) String() string 
var _ = IntSet{}.String() // compile error: String requires *IntSet receiver 


但 是 我 们 可 以 在 一 个 IntSet 值 上 调用 这 个 方法 : 


var s IntSet 
var = s.String() // OK: s is a variable and &s has a String method 


然而 ， 由 于 只 有 /ntSet 类 型 有 String 方 法 ， 所 有 也 只 有 IntSet 类 型 实现 了 fmt.Stringer 接 口 : 


var _ fmt.Stringer = &s // OK 
var _ fmt.Stringer = s // compile error: IntSet lacks String method 


12.8 章 包含 了 一 个 打印 出 任意 值 的 所 有 方法 的 程序 ， 然 后 可 以 使 用 godoc -analysis=type 
tool(§10.7.4) 展 示 每 个 类 型 的 方法 和 具体 类 型 和 接口 之 间 的 关系 


就 像 信封 封装 和 隐藏 信件 起 来 一 样 ， 接 口 类 型 封装 和 隐藏 具体 类 型 和 它 的 值 。 即 使 具体 类 型 
有 其 它 的 方法 也 只 有 接口 类 型 暴露 出 来 的 方法 会 被 调用 到 : 


os.Stdout.wWrite([]byte("hello")) // OK: *os.File has Write method 
os.Stdout.Close() // OK: *os.File has Close method 


var w io.Writer 

w = os.Stdout 

w.Write([]byte("hello")) // OK: io.Writer has Write method 

w.Close() // compile error: io.Writer lacks Close method 


一 个 有 更 多 方法 的 接口 类 型 ， 比 如 io.ReadWriter， 和 少 一 些 方法 的 接口 类 型 ,例如 io.Reader ， 
进行 对 比 ; 更 多 方法 的 接口 类 型 会 告诉 我 们 更 多 关于 它 的 值 持 有 的 信息 ， 并 且 对 实现 它 的 类 
型 要 求 更 加 严格 。 那 么 关于 interfacef} 类 型 ， 它 没有 任何 方法 ， 请 讲 出 哪些 具体 的 类 型 实现 了 
它 ? 


这 看 上 去 好 像 没 有 用 ， 但 实际 上 interfacef} 被 称 为 空 接 口 类 型 是 不 可 或 缺 的 。 因 为 空 接口 类 型 
对 实现 它 的 类 型 没有 要 求 ， 所 以 我 们 可 以 将 任意 一 个 值 赋 给 空 接口 类 型 。 


var any interface{} 

any = true 

any = 12.34 

any = "hello" 

any = map[string]int{"one": 1} 
any = new(bytes.Buffer) 


尽管 不 是 很 明显 ， 从 本 书 最 早 的 的 例子 中 我 们 就 已 经 在 使 用 空 接口 类 型 。 它 允许 像 fmt.Println 
或 者 5.7 章 中 的 errorf 阵 数 接受 任何 类 型 的 参数 。 


对 于 创建 的 一 个 interfacef} 值 持 有 一 个 boolean，float，string，map“，pointer， 或 者 任意 其 它 
的 类 型 ; 我 们 当然 不 能 直接 对 它 持 有 的 值 做 操作 ， 因 为 interfacef} 没 有 任何 方法 。 我 们 会 在 
7.10 章 中 学 到 一 种 用 类 型 断言 来 获取 interface 们 中 值 的 方法 。 
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因为 接口 实现 只 依赖 于 判断 的 两 个 类 型 的 方法 ， 所 以 没有 必要 定义 一 个 具体 类 型 和 它 实现 丰 
接口 之 间 的 关系 。 也 就 是 说 ， 尝 试 文档 化 和 断言 这 种 关系 几乎 没有 用 ， 所 以 并 没有 通过 程序 
强制 定义 。 下 面 的 定义 在 编译 期 断言 一 个 *bytes.Buffer 的 值 实现 了 io.Writer 接 口 类 型 : 


// *bytes.Buffer must satisfy io.Writer 


var w io.Writer = new(bytes.Buffer) 
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接口 ， 所 以 我 们 不 必 分 配 一 个 新 的 变量 。 并 且 因 为 我 们 绝 不 会 引用 变量 WwW， 我 们 可 以 使 用 空 标 
识 符 来 来 进行 代替 。 总 的 看 ， Me 一 个 更 朴素 的 版 本 : 


// *bytes.Buffer must satisfy io.Writer 
var _ io.Writer = (*bytes.Buffer) (nil) 


非 空 的 接口 类 型 比如 io.Writer 经 常 被 指针 类 型 实现 ， 尤 其 当 一 个 或 多 个 接口 方法 像 Write 方 法 
那样 隐 式 的 给 接收 者 带 来 变化 的 时 候 。 一 个 结构 体 的 指针 是 非常 常见 的 承载 方法 的 类 型 。 


oD ep a «emanate ties 
0 语言 中 其 它 的 引用 类 型 实现 。 我 们 已 经 看 过 slice 类 型 的 方法 (geometry.Path, §6.1)4#mapX 

型 a Values, §6.2.1) > A RAZA 3] BAKA h F 1K 1 | F (http. HandlerFunc, 

8S87.7)。 其 至 基本 的 类 型 也 可 能 会 实现 一 些 接口 ; 就 如 我 们 在 7.4 章 中 看 到 的 time.Duration 类 型 

实现 了 fmt.Stringer 接 口 。 


一 个 具体 的 类 型 可 能 实现 了 很 多 不 相关 的 接口 。 考 虑 在 一 个 组 织 出 售 数字 文化 产品 比如 音 
电影 和 书籍 的 程序 中 可 能 定义 了 下 列 的 具体 类 型 : 


Album 
Book 
Movie 
Magazine 
Podcast 
TVEpisode 
Track 


我 们 可 以 把 每 个 抽象 的 特点 用 接口 来 表示 。 一 些 特性 对 于 所 有 的 这 些 文化 产品 都 是 共通 的 ， 
例如 标题 ， 创 作 日 期 和 作者 列表 。 


type Artifact interface { 
Title() string 
Creators() []string 
Created() time.Time 


其 它 的 一 些 特性 只 对 特定 类 型 的 文化 产品 才 有 。 和 文字 排版 特性 相关 的 只 有 books 和 
magazines， 还 有 只 有 movies 和 TV 剧 集 和 屏幕 分 辩 率 相关 。 


type Text interface { 
Pages() int 
Words() int 
PageSize() int 
} 
type Audio interface { 
Stream() (io.ReadCloser, error) 
RunningTime() time.Duration 
Format() string // e.g., "MP3", "WAV" 
} 
type Video interface { 
Stream() (io.ReadCloser, error) 
RunningTime() time.Duration 
Format() string // e.g., "MP4", "WMV" 
Resolution() (x, y int) 


这 些 接口 不 止 是 一 种 有 用 的 方式 来 分 组 相关 的 具体 类 型 和 表示 他 们 之 间 的 共同 特定 。 我 们 后 
面 可 能 会 发 现 其 它 的 分 组 。 举 例 ， 如 果 我 们 发 现 我 们 需要 以 同样 的 方式 处 理 Audio 和 Video > 
我 们 可 以 定义 一 个 Streamer 接 口 来 代表 它们 之 间 相 同 的 部 分 而 不 必 对 已 经 存在 的 类 型 做 改 


TTR 


type Streamer interface { 
Stream() (io.ReadCloser, error) 
RunningTime() time.Duration 
Format() string 


每 一 个 具体 类 型 的 组 基于 它们 相同 的 行为 可 以 表示 成 一 个 接口 类 型 。 不 像 基于 类 的 语言 ， 他 
们 一 个 类 实现 的 接口 集合 需要 进行 显 式 的 定义 ， 在 Go 语言 中 我 们 可 以 在 需要 的 时 候 定义 一 个 
新 的 抽象 或 者 特定 特点 的 组 ， 而 不 需要 修改 具体 类 型 的 定义 。 当 具体 的 类 型 来 自 不 同 的 作者 


时 这 种 方式 会 特别 有 用 。 当 然 也 确实 没有 必要 在 具体 的 类 型 中 指出 这 些 共性 。 
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在 本 章 ， o 另 一 个 标准 的 接口 类 型 flag.Value 是 怎么 帮助 命令 行 标记 定义 新 的 符号 
的 。 思 考 下 面 这 个 会 休眠 特定 时 间 的 程序 : 


</i>gopl.io/ch7/sleep</i> 


var period = flag.Duration("period", i*time.Second, "sleep period") 


func main() { 
flag.Parse() 
fmt.Printf("Sleeping for %v...", *period) 
time.Sleep(*period) 
fmt.Println() 


在 它 休 眼前 它 会 打印 出 休 卢 的 时 间 周 期 。fmt 包 调用 time.Duration 的 String 方 法 打印 这 个 时 间 
周期 是 以 用 户 友 好 的 注解 方式 ， 而 不 是 一 个 纳 秒 数字 : 


$ go build gopl.io/ch7/sleep 
$ ./sleep 
Sleeping for 1s... 


默认 情况 下 ， 休 眼 周 期 是 一 秒 ， 但 是 可 以 通过 -period 这 个 命令 行 标记 来 控制 。flag.Duration 
函数 创建 一 个 time.Duration 类 型 的 标记 变量 并 且 允 许 用 户 通过 多 种 用 户 友 好 的 方式 来 设置 这 
个 变量 的 大 小 ， 这 种 方式 还 包括 和 String 方 法 相同 的 符号 排版 形式 。 这 种 对 称 设计 使 得 用 户 交 
互 良 好 。 


$ ./sleep -period 50ms 

Sleeping for 50ms... 

$ ./sleep -period 2m30s 

Sleeping for 2m30s... 

$ ./sleep -period 1.5h 

Sleeping for 1h30mOs... 

$ ./sleep -period "1 day" 

invalid value "1 day" for flag -period: time: invalid duration 1 day 


因为 时 间 周 期 标记 值 非常 的 有 用 ， 所 以 这 个 特性 被 构建 到 了 flag 包 中 ; 但 是 我 们 为 我 们 自己 的 
数据 类 型 定义 新 的 标记 符号 是 简单 容易 的 。 我 们 只 需要 定义 一 个 实现 flag.Value 接 口 的 类 型 ， 
如 下 : 


package flag 


// Nalue is the interface to the value stored in a flag. 
type Value interface { 

String() string 

Set(string) error 


String 方 法 格式 化 标记 的 值 用 在 命令 行 帮 组 消息 中 ; 这 样 每 一 个 flag.Value 也 是 一 个 
fmt.Stringer。Set 方 法 解析 它 的 字符 串 参 数 并 且 更 新 标记 变量 的 值 。 实 际 上 ，Set 方 法 和 String 
是 两 个 相反 的 操作 ， 所 以 最 好 的 办 法 就 是 对 他 们 使 用 相同 的 注解 方式 。 


证 我们 定义 一 个 允许 通过 摄氏 度 或 者 华 色 温度 变换 的 形式 指定 温度 的 celsiusFlag 类 型 。 注 意 
celsiusFlag 内 嵌 了 一 个 Celsius 类 型 (§2.5)， 因 此 不 用 实现 本 身 就 已 经 有 String 方 法 了 。 为 了 实 
现 flag.Value， 我 们 只 需要 定义 Set 方 法 : 


gopl.io/ch7/tempconv 


// *celsiusFlag satisfies the flag.Value interface. 
type celsiusFlag struct{ Celsius } 


func (f *celsiusFlag) Set(s string) error { 
var unit string 
var value float64 
fmt.Sscanf(s, "%f%s", &value, &unit) // no error check needed 
switch unit { 
case: UCU Togi: 
f.Celsius = Celsius(value) 
return nil 
case "F", "°F": 
f.Celsius = FToC(Fahrenheit(value) ) 
return nil 


} 


return fmt.Errorf("invalid temperature %q", s) 


调用 fmt.Sscanf 了 部 数 从 输入 s 中 解析 一 个 浮 点 数 (value) 和 一 个 字符 串 (unit) 。 虽 然 通常 必 
须 检 查 Sscanf 的 错误 返回 ， 但 是 在 这 个 例子 中 我 们 不 需要 因为 如 果 有 错误 发 生 ， 就 没有 switch 
case 会 匹配 到 。 


下 面 的 CelsiusFlag 元 数 将 所 有 逻辑 都 封装 在 一 起 。 它 返回 一 个 内 诅 在 celsiusFlag 交 量 f 中 的 
Celsius 指 针 给 调用 者 。Celsius 字 段 是 一 个 会 通过 Set 方 法 在 标记 处 理 的 过 程 中 更 新 的 变量 。 
调用 Var 方法 将 标记 加 入 应 用 的 命令 行 标记 集合 中 ， 有 异常 复杂 命令 行 接口 的 全 局 变量 
flag.CommandLine.Programs 可 能 有 几 个 这 个 类 型 的 变量 。 调 用 Var 方 法 将 一 个 celsiusFlag 参 
数 赋值 给 一 个 flag.Value 参 数 ,导致 编译 器 去 检查 celsiusFlag 是 否 有 必须 的 方法 。 


// CelsiusFlag defines a Celsius flag with the specified name, 
// default value, and usage, and returns the address of the flag variable. 
// The flag argument must have a quantity and a unit, e.g., "100C". 
func CelsiusFlag(name string, value Celsius, usage string) *Celsius { 
f := celsiusFlag{value} 
flag.CommandLine.Var(&f, name, usage) 
return &f.Celsius 


现在 我 们 可 以 开始 在 我 们 的 程序 中 使 用 新 的 标记 : 
gopl.io/ch7/tempflag 


var temp = tempconv.CelsiusFlag("temp", 20.0, "the temperature") 


func main() { 
flag.Parse() 
fmt.Println(*temp) 


下 面 是 典型 的 场景 : 


$ go build gopl.io/ch7/tempflag 
$ ./tempflag 


20°C 
$ ./tempflag -temp -18C 
-18°C 
$ ./tempflag -temp 212°F 
100°C 


$ ./tempflag -temp 273.15K 
invalid value "273.15K" for flag -temp: invalid temperature "273.15K" 
Usage of ./tempflag: 
-temp value 
the temperature (default 20°C) 
$ ./tempflag -help 
Usage of ./tempflag: 
-temp value 
the temperature (default 20°C) 


练习 7.6: 对 tempFlag 加 入 支持 开尔文 温度 。 


练习 7.7 : 解释 为 什么 帮助 信息 在 它 的 默认 值 是 20.0 没 有 包含 "C 的 情况 下 输出 了 °C。 


7.5. 接口 值 


概念 上 讲 一 个 接口 的 值 ， 接 口 值 ， 由 两 个 部 分 组 成 ， 一 个 具体 的 类 型 和 那个 类 型 的 值 。 它 们 
被 称 为 接口 的 动态 类 型 和 动态 值 。 对 于 像 Go 语言 这 种 静态 类 型 的 语言 ， 类 型 是 编译 期 的 概 
念 ; 因此 一 个 类 型 不 是 一 个 值 。 在 我 们 的 概念 模型 中 ， 一 些 提供 每 个 类 型 信息 的 值 被 称 为 类 
型 描述 符 ， 比 如 类 型 的 名 称 和 方法 。 在 一 个 接口 值 中 ， 类 型 部 分 代表 与 之 相关 类 型 的 描述 
符 。 


下 面 4 个 语句 中 ， 变 量 w 得 到 了 3 个 不 同 的 值 。 (开始 和 最 后 的 值 是 相同 的 ) 
var w io.Writer 
w = os.Stdout 


w = new(bytes.Buffer ) 
w = nil 


让 我 们 进一步 观察 在 每 一 个 语句 后 的 w 变 量 的 值 和 动态 行为 。 第 一 个 语 
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var w io.Writer 


在 Go 语言 中 ， 变 量 总 是 被 一 个 定义 明确 的 值 初始 化 ， 即 使 接口 类 型 也 不 例外 。 对 于 一 个 接口 
的 零 值 就 是 它 的 类 型 和 值 的 部 分 都 是 nil (图 7.1) ° 


type nil 


value nil 


Figure 7.1. A nil interface value. 


一 个 接口 值 基于 它 的 动态 类 型 被 描述 为 空 或 非 室 ， 所 以 这 是 一 个 空 的 接口 值 。 你 可 以 通过 使 
用 WwW==nil 或 者 wl=nil 来 判读 接口 值 是 否 为 室 。 调 用 一 个 空 接口 值 上 的 任意 方法 都 会 产生 panic: 


w.Write([]byte("hello")) // panic: nil pointer dereference 


第 二 个 语句 将 一 个 *os.File 类 型 的 值 赋 给 变量 W: 


w = os.Stdout 


这 个 赋值 过 程 调用 了 一 个 具体 类 型 到 接口 类 型 的 隐 式 转换 ， 这 和 显 式 的 使 用 
io.Writer(os.Stdout) 是 等 价 的 。 这 类 转换 不 管 是 显 式 的 还 是 隐 式 的 ， 都 会 刻画 出 操作 到 的 类 型 
和 人 和 值 。 这 个 接口 值 的 动态 类 型 被 设 为 *os.Stdout 指 针 的 类 型 描述 符 ， 它 的 动态 值 持 有 os.Stdout 


的 拷贝 ; 这 是 一 个 代表 处 理 标准 输出 的 OS.File 类 型 变量 的 指针 (图 7.2) ° 






*os.File os.File 


Figure 7.2. An interface value containing an *os.File pointer. 


fd int = 1 (stdout) 





调用 一 个 包含 *os.File 类 型 指针 的 接口 值 的 Write 方法 ， 使 得 (*os.File).Write 方 法 被 调用 。 这 个 
调用 输出 “hello”。 


w.Write([]byte("hello")) // "hello" 


通常 在 编译 期 ， 我 们 不 知道 接口 值 的 动态 类 型 是 什么 ， 所 以 一 个 接口 上 的 调用 必须 使 用 动态 
分 配 。 因 为 不 是 直接 进行 调用 ， 所 以 编译 器 必须 把 代码 生成 在 类 型 描述 符 的 方法 Write 上 ， 然 
后 间接 调用 那个 地 址 。 这 个 调用 的 接收 者 是 一 个 接口 动态 值 的 捞 贝 ，os.Stdout。 效 果 和 下 面 
这 个 直接 调用 一 样 : 

os .Stdout .Write([]byte("hello")) // "hello" 


Fh = a BE IK T —4*bytes.BufferX # 49 fa 


w = new(bytes.Buffer ) 


现在 动态 类 型 是 *sbytes.Buffer 并 且 动 态 值 是 一 个 指向 新 分 配 的 缓冲 区 的 指针 (图 7.3) ° 


bytes.Buffer 


type 
data []byte 
value e 


Figure 7.3. An interface value containing a *bytes .Buffer pointer. 





Write 方法 的 调用 也 使 用 了 和 之 前 一 样 的 机 制 : 


w.Write([]byte("hello")) // writes "hello" to the bytes.Buffers 


这 次 类 型 描述 符 是 *bytes.Buffer， 所 以 调用 了 (*bytes.Buffen).Write 方 法 ， 并 且 接收 者 是 该 缓冲 
区 的 地 址 。 这 个 调用 把 字符 串 “hello" 添 加 到 缓冲 区 中 。 


最 后 ， 第 四 个 语句 将 nil 赋 给 了 接口 值 : 


w = nil 
这 个 重 置 将 它 所 有 的 部 分 都 设 为 nil 值 ， 把 变量 w 恢 复 到 和 它 之 前 定义 时 相同 的 状态 图 ， 在 图 
7.1 中 可 以 看 到 。 


一 个 接口 值 可 以 持 有 任意 大 的 动态 值 。 例 如 ， 表 示 时 间 实 例 的 time.Time 类 型 ， 这 个 类 型 有 几 
个 对 外 不 公开 的 字段 。 我 们 从 它 上 面 创 建 一 个 接口 值 ， 


var x interface{} = time.Now() 


结果 可 能 和 图 7.4 相 似 。 从 概念 上 讲 ， 不 论 接口 值 多 大 ， 动 态 值 总 是 可 以 容 下 它 。 (这 只 是 一 
个 概念 上 的 模型 ; 具体 的 实现 可 能 会 非常 不 同 ) 


time.Time 


sec: 63567389742 


nsec: 689632918 


loc: “UTC” 





Figure 7.4. An interface value holding a time. Time struct. 


接口 值 可 以 使 用 三 = 和 ! 三 来 进行 比较 。 两 个 接口 值 相等 仅 当 它们 都 是 nil 值 或 者 它们 的 动态 
类 型 相同 并 且 动 态 值 也 根据 这 个 动态 类 型 的 三 三 操作 相等 。 因 为 接口 值 是 可 比较 的 ， 所 以 它 
们 可 以 用 在 map 的 键 或 者 作为 switch 语 句 的 操作 数 。 


然而 ， 如 果 两 个 接口 值 的 动态 类 型 相同 ， 但 是 这 个 动态 类 型 是 不 可 比较 的 (比如 切片 ) ， 将 
它们 进行 比较 就 会 失败 并 且 panic: 


var x interface{} = []int{1, 2, 3} 
fmt.Println(x == x) // panic: comparing uncomparable type []Jint 


考虑 到 这 点 ， 接 口 类 型 是 非常 与 众 不 同 的 。 其 它 类 型 要 么 是 安全 的 可 比较 类 型 (如 基本 类 型 
和 指针 ) 要 么 是 完全 不 可 比较 的 类 型 (如 切片 ， 映 射 类 型 ， 和 函数 ) ， 但 是 在 比较 接口 值 或 
者 包含 了 接口 值 的 聚合 类 型 时 ， 我 们 必须 要 意识 到 潜在 的 panic。 同 样 的 风险 也 存在 于 使 用 接 
口 作为 map 的 键 或 者 switch 的 操作 数 。 只 能 比较 你 非常 确定 它们 的 动态 值 是 可 比较 类 型 的 接口 
值 。 


当 我 们 处 理 错误 或 者 调试 的 过 程 中 ， 得 知 接口 值 的 动态 类 型 是 非常 有 帮助 的 。 所 以 我 们 使 用 
fmt 包 的 %T 动 作 : 


var w io.Writer 

fmt.Printf("%T\n", w) // "<nil>" 

w = os.Stdout 

fmt .Printf("%T\n", w) // "*os.File" 

w = new(bytes.Buffer) 

fmt.Printf("%T\n", w) // "*bytes.Buffer" 


在 fmt 包 内 部 ， 使 用 反射 来 获取 接口 动态 类 型 的 名 称 。 我 们 会 在 第 12 章 中 学 到 反射 相关 的 知 


TRO 


7.5.1. 警告 : 一 个 包含 nil 指 针 的 接口 不 是 nil 接 口 


一 个 不 包含 任何 值 的 nil 接 口 值 和 一 个 刚好 包含 nil 指 针 的 接口 值 是 不 同 的 。 这 个 细微 区 别 产生 
了 一 个 容易 绊 倒 每 个 Go 程序 员 的 陷阱 。 


思考 下 面 的 程序 。 当 debug 变 量 设 置 为 true 时 ，main 也 数 会 将 f 函 数 的 输出 收集 到 一 个 
bytes.Buffer 类 型 中 。 


const debug = true 


func main() { 
var buf *bytes.Buffer 
if debug { 
buf = new(bytes.Buffer) // enable collection of output 


} 
f(buf) // NOTE: subtly incorrect! 
if debug { 
He vy USES uh 
} 


// If out is non-nil, output will be written to it. 
func f(out io.Writer) { 
// ...d0 something... 
if out != nil { 
out .Write([]byte("done!\n")) 


我 们 可 能 会 预计 当 把 变量 debug 设 置 为 false 时 可 以 禁止 对 输出 的 收集 ， 但 是 实际 上 在 out.Write 
方法 调用 时 程序 发 生 了 panic : 


if out != nil { 


out.Write([]byte("done!\n")) // panic: nil pointer dereference 


当 main 兄 数 调用 函数 fT 时， 它 给 {元 数 的 oUt 参数 赋 了 一 个 *bytes.Buffer 的 空 指 针 ， 所 以 oUt 的 动 
态 值 是 nil。 然 而 ， 它 的 动态 类 型 是 *bytes.Buffer， 意 思 就 是 out 变 量 是 一 个 包含 空 指针 值 的 非 
空 接口 (如 图 7.5) ， 所 以 防御 性 检查 outl=nil 的 结果 依然 是 true 。 


type *bytes.Buffer 





Figure 7.5. A non-nil interface containing a nil pointer. 


动态 分 配 机 制 依然 决定 (*bytes.Buffen).Write 的 方法 会 被 调用 ， 但 是 这 次 的 接收 者 的 值 是 nil © 
对 于 一 些 如 *os.File 的 类 型 ，nil 是 一 个 有 效 的 接收 者 ($6.2.1)， 但 是 *bytes.Buffer 类 型 不 在 这 些 
类 型 中 。 这 个 方法 会 被 调用 ， 但 是 当 它 尝试 去 获取 缓冲 区 时 会 发 生 panic 。 


问题 在 于 尽管 一 个 nil 的 *bytes.Buffer 指 针 有 实现 这 个 接口 的 方法 ， 它 也 不 满足 这 个 接口 具体 的 
行为 上 的 要 求 。 特 别 是 这 个 调用 违反 了 (*bytes.Buffen).Write 方 法 的 接收 者 非 空 的 隐 含 先觉 条 
件 ， 所 以 将 nil 指 针 赋 给 这 个 接口 是 错误 的 。 解 决 方案 就 是 将 main 兄 数 中 的 变量 buf 的 类 型 改 为 
io.Writer， 因 此 可 以 避免 一 开始 就 将 一 个 不 完全 的 值 赋值 给 这 个 接口 : 


var buf io.Writer 
if debug { 
buf = new(bytes.Buffer) // enable collection of output 


} 
f(buf) // OK 


现在 我 们 已 经 把 接口 值 的 技巧 都 讲 完了 ， 让 我 们 来 看 更 多 的 一 些 在 Go 标准 库 中 的 重要 接口 类 
型 。 在 下 面 的 三 章 中 ， 我 们 会 看 到 接口 类 型 是 怎样 用 在 排序 ，web 服 务 ， 错 误 处 理 中 的 。 


7.6. sort.Interface7z 7 


排序 操作 和 字符 串 格式 化 一 样 是 很 多 程序 经 常 使 用 的 操作 。 尽 管 一 个 最 短 的 快 排 程 序 只 要 15 
行 就 可 以 搞定 ， 但 是 一 个 健壮 的 实现 需要 更 多 的 代码 ， 并 且 我 们 不 希望 每 次 我 们 需要 的 时 候 
都 重 写 或 者 拷贝 这 些 代 码 。 


幸运 的 是 ，sort 包 内 置 的 提供 了 根据 一 些 排序 函数 来 对 任何 序列 排序 的 功能 。 它 的 设计 非常 独 
到 。 在 很 多 语言 中 ， 排 序 算法 都 是 和 序列 数据 类 型 关联 ， 同 时 排序 函数 和 具体 类 型 元 素 关 

联 。 相 比 之 下 ，Go 语 言 的 sort.Sort 骂 数 不 会 对 具体 的 序列 和 它 的 元 素 做 任何 假设 。 相 反 ， 它 
使 用 了 一 个 接口 类 型 sort.Interface 来 指定 通用 的 排序 算法 和 可 能 被 排序 到 的 序列 类 型 之 间 的 约 
定 。 这 个 接口 的 实现 由 序列 的 具体 表示 和 它 希 望 排序 的 元 素 决定 ， 序 列 的 表示 经 常 是 一 个 切 
片 。 


一 个 内 置 的 排序 算法 需要 知道 三 个 东西 : 序列 的 长 度 ， 表 示 两 个 元 素 比 较 的 结果 ， 一 种 交换 
两 个 元 素 的 方式 ; 这 就 是 sort.Interface 的 三 个 方法 : 


package Sort 


type Interface interface { 
Len() int 
Less(i, j int) bool // i, j are indices of sequence elements 
Swap(i, j int) 


为 了 对 序列 进行 排序 ， 我 们 需要 定义 一 个 实现 了 这 三 个 方法 的 类 型 ， 然 后 对 这 个 类 型 的 一 个 
实例 应 用 sort.Sort 骂 数 。 思 考 对 一 个 字符 串 切 片 进行 排序 ， 这 可 能 是 最 简单 的 例子 了 。 下 面 是 
这 个 新 的 类 型 StringSlice 和 它 的 Len，Less 和 Swap 方 法 


type StringSlice []string 

func (p StringSlice) Len() int { return len(p) } 

func (p StringSlice) Less(i, j int) bool { return p[i] < p[j] } 

func (p StringSlice) Swap(i, j int) { p[i], p[j] = pli], p[i] } 


现在 我 们 可 以 通过 像 下 面 这 样 将 一 个 切片 转换 为 一 个 StringSlice 类 型 来 进行 排序 : 
sort.Sort(StringSlice(names) ) 

这 个 转换 得 到 一 个 相同 长 度 ， 容 量 ， 和 基于 names 数 组 的 切片 值 ; 并 且 这 个 切片 值 的 类 型 有 

三 个 排序 需要 的 方法 。 


对 字符 串 切 片 的 排序 是 很 常用 的 需要 ， 所 以 sort 包 提供 了 StringSlice 类 型 ， 也 提供 了 Strings 艺 
数 能 让 上 面 这 些 调用 简化 成 sort.Strings(names)。 


这 里 用 到 的 技术 很 容易 适用 到 其 它 排序 序列 中 ， 例 如 我 们 可 以 忽略 大 些 或 者 含有 特殊 的 字 
符 。 (本 书 使 用 Go 程序 对 索引 词 和 页 码 进行 排序 也 用 到 了 这 个 技术 ， 对 罗马 数字 做 了 额外 加 
辑 处 理 。) 对 于 更 复杂 的 排序 ， 我 们 使 用 相同 的 方法 ， 但 是 会 用 更 复杂 的 数据 结构 和 更 复杂 
地 实现 sort.Interface 的 方法 。 


我 们 会 运行 上 面 的 例子 来 对 一 个 表格 中 的 音乐 播放 列表 进行 排序 。 每 个 track 都 是 单独 的 一 
行 ， 每 一 列 都 是 这 个 track 的 属性 像 艺术 家 ， 标 题 ， 和 运行 时 间 。 想 象 一 个 图 形 用 户 界 面 来 呈 
现 这 个 表格 ， 并 且 点 击 一 个 属性 的 顶部 会 使 这 个 列表 按照 这 个 属性 进行 排序 ; 再 一 次 点 击 相 
同属 性 的 顶部 会 进行 逆向 排序 。 让 我 们 看 下 每 个 点 击 会 发 生 什么 响应 。 


下 面 的 变量 tracks 包 好 了 一 个 播放 列表 。 (One of the authors apologizes for the other 
author’s musical tastes.) 每 个 元 素 都 不 是 Track 本 身 而 是 指向 它 的 指针 。 尽 管 我 们 在 下 面 的 代 
码 中 直接 存储 Tracks 也 可 以 工作 ，sort 函 数 会 交换 很 多 对 元 素 ， 所 以 如 果 每 个 元 素 都 是 指针 会 
更 快 而 不 是 全 部 Track 类 型 ， 指 针 是 一 个 机 器 字 码 长 度 而 Track 类 型 可 能 是 八 个 或 更 多 。 


gopl.io/ch7/sorting 


type Track struct { 
Title string 
Artist string 
Album string 
Year int 
Length time.Duration 


var tracks = []*Track{ 
{"Go", "Delilah", "From the Roots Up", 2012, length("3m38s")}, 
{"Go", "Moby", "Moby", 1992, length("3m37s")}, 
{"Go Ahead", "Alicia Keys", "As I Am", 2007, length("4m36s")}, 
{"Ready 2 Go", "Martin Solveig", "Smash", 2011, length("4m24s")}, 


} 
func length(s string) time.Duration { 
d, err := time.ParseDuration(s) 
if err != nil { 
panic(s) 
} 
return d 


printTracks 函 数 将 播放 列表 打印 成 一 个 表格 。 一 个 图 形 化 的 展示 可 能 会 更 好 点 ， 但 是 这 个 小 程 
序 使 用 text/tabwriter 包 来 生成 一 个 列 是 整齐 对 齐 和 隔 开 的 表格 ， 像 下 面 展 示 的 这 样 。 注 意 到 
*tabwriter.Writer 是 满足 io.Writer 接 口 的 。 它 会 收集 每 一 片 写 向 它 的 数据 ; 它 的 Flush 方 法 会 格 
式 化 整个 表格 并 且 将 它 写 向 os.Stdout (标准 输出 ) ° 


func printTracks(tracks []*Track) { 
const format = "%v\t%v\t%v\t%v\t%v\t\n" 


tw := new(tabwriter.Writer).Init(os.Stdout, ©, 8, 2, ' ', 0) 
fmt.Fprintf(tw, format, "Title", "Artist", "Album", "Year", "Length") 
fmt.Fprintf(tw, format, "----- ", "------ ", "----- ", "----", "------ L 
for _, t := range tracks { 


fmt.Fprintf(tw, format, t.Title, t.Artist, t.Album, t.Year, t.Length) 
} 


tw.Flush() // calculate column widths and print table 


为 了 能 按照 Artist 字 段 对 播放 列表 进行 排序 ， 我 们 会 像 对 StringSlice 那 样 定 义 一 个 新 的 带 有 必 
须 Len，Less 和 Swap 方 法 的 切片 类 型 。 


type byArtist []*Track 

func (x byArtist) Len() int { return len(x) } 

func (x byArtist) Less(i, j int) bool { return x[i].Artist < x[j].Artist } 
func (x byArtist) Swap(i, j int) { x[i], x{j] = x{j], x[i] } 


为 了 调用 通用 的 排序 程序 ， 我 们 必须 先 将 tracks 转 换 为 新 的 byArtist 类 型 ， 它 定义 了 具体 的 排 
序 : 


sort.Sort(byArtist(tracks) ) 


在 按照 artist 对 这 个 切片 进行 排序 后 ，printTrack 的 输出 如 下 


Title Artist Album Year Length 
Go Ahead Alicia Keys As I Am 2007 4m36s 
Go Delilah From the Roots Up 2012 3m38s 
Ready 2 Go Martin Solveig Smash 2011 4m24s 
Go Moby Moby 1992 3m37s 


如 果 用 户 第 二 次 请 求 “按照 artist 排 序 "”， 我 们 会 对 tracks 进 行 送 向 排序 。 然 而 我 们 不 需要 定义 一 
MA Hh ElLess 7 ik tg HH K A byReverseArtist > A A sort & P 444 T Reverse $ ZA HEP MA Ae 
换 成 逆序 。 


sort.Sort(sort.Reverse(byArtist(tracks) )) 


在 按照 artist 对 这 个 切片 进行 逆向 排序 后 ，printTrack 的 输出 如 下 


Title Artist Album Year Length 


Go Moby Moby 1992 3m37s 
Ready 2 Go Martin Solveig Smash 2011 4m24s 
Go Delilah From the Roots Up 2012 3m38s 
Go Ahead Alicia Keys As I Am 2007 4m36s 


sort.Reverse 函 数值 得 进行 更 近 一 步 的 学 习 因 为 它 使 用 了 (S6.3) 章 中 的 组 合 ， 这 是 一 个 重要 的 
思路 。sort 包 定义 了 一 个 不 公开 的 struct 类 型 reverse， 它 识 入 了 一 个 sort.Interface。reverse 的 
Less 方 法 调用 了 内 骨 的 sort.Interface 值 的 Less 方 法 ， 但 是 通过 交换 索引 的 方式 使 排序 结果 变 
package sort 
type reverse struct{ Interface } // that is, sort.Interface 


func (r reverse) Less(i, j int) bool { return r.Interface.Less(j, i) } 


func Reverse(data Interface) Interface { return reverse{data} } 


reverse ty 4 9b AAA KLen#e Swaplke 1.34 HR A A i AY sort.Interfacedz tt ° Al Areversex — 
个 不 公开 的 类 型 ， 所 以 导出 函数 Reverse 函 数 返回 一 个 包含 原 有 sort.Interface 值 的 reverse 类 型 
实例 。 


为 了 可 以 按照 不 同 的 列 进行 排序 ， 我 们 必须 定义 一 个 新 的 类 型 例如 byYear : 


type byYear []*Track 


func (x byYear) Len() int { return len(x) } 
func (x byYear) Less(i, j int) bool { return x[i].Year < x[j].Year } 
func (x byYear) Swap(i, j int) { x[i], x[j] = x[j], x[i] } 


在 使 用 sort.Sort(byYear(tracks)) 按 照 年 对 tracks 进 行 排序 后 ，printTrack 展 示 了 一 个 按时 间 先 后 
顺序 的 列表 : 


Title Artist Album Year Length 
Go Moby Moby 1992 3m37s 
Go Ahead Alicia Keys As I Am 2007 4m36s 
Ready 2 Go Martin Solveig Smash 2011 4m24s 
Go Delilah From the Roots Up 2012 3m38s 


对 于 我 们 需要 的 每 个 切片 元 素 类 型 和 每 个 排序 函数 ， 我 们 需要 定义 一 个 新 的 sort.Interface 实 
现 。 如 你 所 见 ，Len 和 Swap 方 法 对 于 所 有 的 切片 类 型 都 有 相同 的 定义 。 下 个 例子 ， 有 具体 的 类 
型 customSort 会 将 一 个 切片 和 函数 结合 ， 使 我 们 只 需要 写 比 较 函 数 就 可 以 定义 一 个 新 的 排 


序 。 顺 便 说 下 ， 实 现 了 sort.Interface 的 具体 类 型 不 一 定 是 切片 类 型 ; customSort 是 一 个 结构 体 
类 型 。 


type customSort struct { 
t []*Track 
less func(x, y *Track) bool 


} 


func (x customSort) Len() int 
func (x customSort) Less(i, j int) bool { return x.less(x.t[i], x.t[j]) } 


func (x customSort) Swap(i, j int) { x.t[i], x.t[j] = x.t[j], x.t[i] } 
让 我 们 定义 一 个 多 层 的 排序 函数 ， 它 主要 的 排序 键 是 标题 ， 第 二 个 键 是 年 ， 第 三 个 键 是 运行 


时 间 Length 。 下 面 是 该 排序 的 调用 ， 其 中 这 ee 


sort.Sort(customSort{tracks, func(x, y *Track) bool { 
if x.Title != y.Title { 
return x.Title < y.Title 


} 

if x.Year != y.Year { 
return x.Year < y.Year 

} 


if x.Length != y.Length { 
return x.Length < y.Length 
} 


return false 


}}) 


这 下 面 是 排序 的 结果 。 注 意 到 两 个 标题 是 “Go” 的 track 按 照 标题 排序 是 相同 的 顺序 ， 但 是 在 按 
照 year 排 序 上 更 久 的 那个 track 优 先 。 


Title Artist Album Year Length 
Go Moby Moby 1992 3m37s 
Go Delilah From the Roots Up 2012 3m38s 
Go Ahead Alicia Keys As I Am 2007 4m36s 
Ready 2 Go Martin Solveig Smash 2011 4m24s 


尽管 对 长 度 为 n 的 序列 排序 需要 O(n log n) 次 比较 操作 ， 检 查 一 个 序列 是 否 已 经 有 序 至 少 需 要 n 
-1 次 比较 。sort 包 中 的 IsSorted 函 数 帮 我 们 做 这 样 的 检查 。 像 sort.Sort 一 样 ， 它 也 使 用 
sort.Interface 对 这 个 序列 和 它 的 排序 函数 进行 抽象 ， 但 是 它 从 不 会 调用 Swap 方 法 : RARA 
7 Jt T IntsAreSorted#e Ints & 2 4 IntSlice & #! 491% A: 


values := []int{3, 1, 4, 1} 


fmt.Println(sort.IntsAreSorted(values)) // "false" 
sort.Ints(values) 
fmt .Println(values) Hag *\pak ales 4) 


fmt.Println(sort.IntsAreSorted(values)) // " 
sort.Sort(sort.Reverse(sort.IntSlice(values) ) ) 

fmt .Println(values) Hp 3} al aly]! 
fmt.Println(sort.IntsAreSorted(values)) // "false" 


为 了 使 用 方便 ，sort 包 为 [jint,[]string 和 [float64 的 正常 排序 提供 了 特定 版 本 的 函数 和 类 型 。 对 
于 其 他 类 型 ， 例 如 [int64 或 者 [juint， 尽 管 路 径 也 很 简单 ， 还 是 依赖 我 们 自己 实现 。 


练习 7.8: 很 多 图 形 界面 提供 了 一 个 有 状态 的 多 重 排序 表格 插件 : 主要 的 排序 键 是 最 近 一 次 
点 击 过 列 头 的 列 ， 第 二 个 排序 键 是 第 二 最 近 点 击 过 列 头 的 列 ， 等 等 。 定 义 一 个 sort.Interface 的 
实现 用 在 这 样 的 表格 中 。 比 较 这 个 实现 方式 和 重复 使 用 sort.Stable 来 排序 的 方式 。 


练习 7.9 : 使 用 htmltemplate 包 (§4.6) 替代 printTracks 将 tracks 展 示 成 一 个 HTML 表 格 。 将 这 
个 解决 方案 用 在 前 一 个 练习 中 ， 让 每 次 点 击 一 个 列 的 头 部 产生 一 个 HTTP 请 求 来 排序 这 个 表 
格 。 

练习 7.10: sort.Interface 类 型 也 可 以 适用 在 其 它 地 方 。 编 写 一 个 lsPalindrome(s 


sort.Interface) bool 函 数 表 明 序 列 S 是 否 是 回 文 序列 ， 换 名 话说 反 向 排序 不 会 改变 这 个 序列 。 假 
设 如 果 !s.Less(i, j) && !s.Less(j, ij) 则 索引 i 和 j 上 的 元 素 相 等 。 
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在 第 一 章 中 ， 我 们 粗略 的 了 解 了 怎么 用 net/http 包 去 实现 网 络 客户 端 ($1.5) 和 服务 器 ($1.7)。 在 
这 个 小 节 中 ， 我 们 会 对 那些 基于 http.Handler 接 口 的 服务 器 API 做 更 进一步 的 学 习 : 

net/http 


package http 


type Handler interface { 
ServeHTTP(w ResponseWriter, r *Request) 


} 


func ListenAndServe(address string, h Handler) error 


ListenAndServe 亏 数 需要 一 个 例如 “localhost:88000” 的 服务 器 地 址 ， 和 一 个 所 有 请 求 都 可 以 分 
派 的 Handler 接 口 实例 。 它 会 一 直 运 行 ， 直 到 这 个 服务 因为 一 个 错误 而 失败 (或 者 启动 失 
败 ) ， 它 的 返回 值 一 定 是 一 个 非 空 的 错误 。 


想 i 为 了 销售 它 的 数据 库 将 它 物品 的 价格 映射 成 美元 。 下 面 这 个 程序 可 
能 是 能 想到 的 最 简单 的 实现 了 。 它 将 库存 清单 模型 化 为 一 个 命 ia R 
们 给 AR —AServeHitpa i ， 这 样 它 可 以 满足 http.Handler 接 口 。 这 个 handler 会 遍历 整 


sna 出 物品 信息 。 
opl.io/ch7/http1 


func main() { 
db := database{"shoes": 50, "socks": 5} 
log.Fatal(http.ListenAndServe("localhost:8000", db)) 
} 


type dollars float32 

func (d dollars) String() string { return fmt.Sprintf("$%.2f—", d) } 

type database map[string]dollars 

func (db database) ServeHTTP(w http.Responsewriter, req *http.Request) { 


for item, price := range db { 
fmt.Fprintf(w, "%s: %s\n", item, price) 


如 果 我 们 启动 这 个 服务 ， 


$ go build gopl.io/ch7/http1 
$ ./http1 & 


然后 用 1.5 节 中 的 获取 程序 (如 果 你 更 喜欢 可 以 使 用 web 浏 览 器 ) 来 连接 服务 器 ,我 们 得 到 下 面 
的 输出 : 


$ go build gopl.io/chi/fetch 

$ ./fetch http://localhost :8000 
shoes: $50.00 

socks: $5.00 


A aA ak > & NIRS BS ARARURLA EAEAN RA HEAR APRs RALHORZSE 
会 定义 多 个 不 同 的 URL， 每 一 个 都 会 触发 一 个 不 同 的 行为 。 让 我 们 使 用 /list 来 调用 已 经 存在 的 
这 个 行为 并 且 增 加 另 一 个 /price 调 用 表明 单个 货品 的 价格 ， 像 这 样 /price?item=socks 来 指定 一 
个 请 求 参数 。 


gopl.io/ch7/http2 


func (db database) ServeHTTP(w http.Responsewriter, req *http.Request) { 
switch req.URL.Path { 
Cals Cline AS ae: 
for item, price := range db { 
fmt.Fprintf(w, "%s: %s\n", item, price) 
} 
CASe peCe 
item := req.URL.Query().Get("item") 
price, ok := db[item] 
if tok { 
w.WriteHeader(http.StatusNotFound) // 404 
fmt.Fprintf(w, "no such item: %q\n", item) 
return 
} 
fmt.Fprintf (w, "%s\n", price) 
default: 
w.WriteHeader(http.StatusNotFound) // 404 
fmt.Fprintf(w, "no such page: %s\n", req.URL) 


现在 handler 基 于 URL 的 路 径 部 分 (req.URL.Path) 来 决定 执行 什么 逻辑 。 如 果 这 个 handler 不 
能 识别 这 个 路 径 ， 它 会 通过 调用 w.WriteHeader(http.StatusNotFound) 返 回 客户 端 一 个 HTTP 
着 误 ; 这 个 检查 应 该 在 向 W 写 入 任何 值 前 完成 。 (顺便 提 一 下 ，http.ResponseWriter 是 另 一 个 
接口 。 它 在 io.Writer 上 增加 了 发 送 HTTP 相 应 头 的 方法 。) 等 效 地 ， 我 们 可 以 使 用 实用 的 
http.Error 24 4 : 


msg := fmt.Sprintf("no such page: %s\n", req.URL) 
http.Error(w, msg, http.StatusNotFound) // 404 


/price 的 case 会 调用 URL 的 Query 方 法 来 将 HTTP 请 求 参 数 解析 为 一 个 map， 或 者 更 准确 地 说 一 
个 net/url 包 中 url.Values(§6.2.1) 类 型 的 多 重 映射 。 然 后 找到 第 一 个 item 参 数 并 查找 它 的 价格 。 
如 果 这 个 货品 没有 找到 会 返回 一 个 错误 。 


这 里 是 一 个 和 新 服务 器 会 话 的 例子 : 


$ go build gopl.io/ch7/http2 

$ go build gopl.io/chi/fetch 

$ ./http2 & 

$ ./fetch http://localhost:8000/list 

shoes: $50.00 

socks: $5.00 

$ ./fetch http://localhost :8000/price?item=socks 
$5.00 

$ ./fetch http://localhost :8000/price?item=shoes 
$50.00 

$ ./fetch http://localhost :8000/price?item=hat 
no such item: "hat" 

$ ./fetch http://localhost :8000/help 

no such page: /help 


显然 我 们 可 以 继续 向 ServeHTTP 方 法 中 添加 case， 但 在 一 个 实际 的 应 用 中 ， 将 每 个 case 中 的 
逻辑 定义 到 一 个 分 开 的 方法 或 函数 中 会 很 实用 。 此 外 ， 相 近 的 URL 可 能 需要 相似 的 逻辑 ; 例 
如 几 个 图 片 文件 可 能 有 形 如 /images/*.png 的 URL。 因 为 这 些 原因 ，net/http 包 提供 了 一 个 请 求 
多 路 器 ServeMux 来 简化 URL 和 handlers 的 联系 。 一 个 ServeMux 将 一 批 http.Handler 聚 集 到 一 
个 单一 的 http.Handler 中 。 再 一 次 ， 我 们 可 以 看 到 满足 同一 接口 的 不 同类 型 是 可 替换 的 : web 
服务 器 将 请 求 指派 给 任意 的 http.Handler 而 不 需要 考虑 它 后 面 的 具体 类 型 。 


对 于 更 复杂 的 应 用 ， 一 些 ServeMux 可 以 通过 组 合 来 处 理 更 加 错综复杂 的 路 由 需求 。Go 语 言 目 
前 没有 一 个 权威 的 web 框 架 ， 就 像 Ruby 语 言 有 Rails 和 python 有 Django。 这 并 不 是 说 这 样 的 框 
架 不 存在 ， 而 是 Go 语言 标准 库 中 的 构建 模块 就 已 经 非常 灵活 以 至 于 这 些 框架 都 是 不 必要 的 。 
此 外 ， 尽 管 在 一 个 项 目 早期 使 用 框架 是 非常 方便 的 ， 但 是 它们 带 来 额外 的 复杂 度 会 使 长 期 的 
维护 更 加 困难 。 


在 下 面 的 程序 中 ， 我 们 创建 一 个 ServeMux 并 且 使 用 它 将 URL 和 相应 处 理 /list 和 /price 操 作 的 
handler 联 系 起 来 ， 这 些 操作 逻辑 都 已 经 被 分 到 不 同 的 方法 中 。 然 后 我 门 在 调用 
ListenAndServe 4 2 ¥ 4# M ServeMuxza 4 + handler ° 


gopl.io/ch7/http3 


func main() { 
db := database{"shoes": 50, "socks": 5} 
mux := http.NewServeMux( ) 
mux.Handle("/list", http.HandlerFunc(db.list) ) 
mux.Handle("/price", http.HandlerFunc(db.price) ) 
log.Fatal(http.ListenAndServe("localhost:8000", mux) ) 


type database map[string]dollars 


func (db database) list(w http.ResponsewWriter, req *http.Request) { 
for item, price := range db { 
fmt.Fprintf (w, "%s: %s\n", item, price) 


func (db database) price(w http.Responsewriter, req *http.Request) { 
item := req.URL.Query().Get("item") 
price, ok := db[item] 
if tok { 
w.WriteHeader(http.StatusNotFound) // 404 
fmt.Fprintf(w, "no such item: %q\n", item) 
return 


} 
fmt.Fprintf(w, "%s\n", price) 


让 我 们 关注 这 两 个 注册 到 handlers 上 的 调用 。 第 一 个 db.list 是 一 个 方法 值 ($6.4)， 它 是 下 面 这 
个 类 型 的 值 


func(w http.Responsewriter, req *http.Request) 


也 就 是 说 db.list 的 调用 会 援引 一 个 接收 者 是 db 的 database.list 方 法 。 所 以 db.list 是 一 个 实现 了 
handler 类 似 行 为 的 函数 ， 但 是 因为 它 没 有 方法 ， 所 以 它 不 满足 http.Handler 接 口 并 且 不 能 直接 
传 给 mux.Handle。 


语句 http.HandlerFunc(db.list) 是 一 个 转换 而 非 一 个 函数 调用 ， 因 为 http.HandlerFunc 是 一 个 类 
型 。 它 有 如 下 的 定义 : 


net/http 


package http 
type HandlerFunc func(w Responsewriter, r *Request) 


func (f HandlerFunc) ServeHTTP(w ResponseWriter, r *Request) { 
f(w, r) 
} 


HandlerFunc 显 示 了 在 Go 语言 接口 机 制 中 一 些 不 同 寻常 的 特点 。 这 是 一 个 有 实现 了 接口 
http.Handler 方 法 的 函数 类 型 。ServeHTTP 方 法 的 行为 调用 了 它 本 身 的 函数 。 因 此 
HandlerFunc 是 一 个 让 函数 值 满足 一 个 接口 的 适配器 ， 这 里 函数 和 这 个 接口 仅 有 的 方法 有 相同 
的 函数 签名 。 实 际 上 ， 这 个 技巧 让 一 个 单一 的 类 型 例如 database 以 多 种 方式 满足 http.Handler 
接口 : 一 种 通过 它 的 list 方 法 ， 一 种 通过 它 的 price 方 法 等 等 。 


因为 handler 通 过 这 种 方式 注册 非常 普遍 ，ServeMux 有 一 个 方便 的 HandleFunc 方 法 ， 它 帮 有 我 
们 简化 handler 注 册 代 码 成 这 样 : 


gopl.io/ch7/http3a 


mux.HandleFunc("/list", db.list) 
mux.HandleFunc('"/price", db.price) 


从 上 面 的 代码 很 容易 看 出 应 该 怎么 构建 一 个 程序 ， 它 有 两 个 不 同 的 web 服 务 器 监听 不 同 的 端口 
的 ， 并 且 定 义 不 同 的 URL 将 它们 指派 到 不 同 的 handler。 我 们 只 要 构建 另外 一 个 ServeMux 并 且 
在 调用 一 次 ListenAndServe (可 能 并 行 的 ) 。 但 是 在 大 多 数 程序 中 ， 一 个 web 服 务 器 就 足够 
了 。 此 外 ， 在 一 个 应 用 程序 的 多 个 文件 中 定义 HTTP handler 也 是 非常 典型 的 ， 如 果 它 们 必须 
全 部 都 显示 的 注册 到 这 个 应 用 的 ServeMux 实 例 上 会 比较 麻烦 。 


所 以 为 了 方便 ，net/http 包 提供 了 一 个 全 局 的 ServeMux 实 例 DefaultServerMux 和 包 级 别 的 
http.Handle 和 http.HandleFunc 驾 数 。 现 在 ， 为 了 使 用 DefaultServeMux 作 为 服务 器 的 主 
handler > AM A F 24% € 4% #ListenAndServe Ak ; nil 值 就 可 以 工作 。 


然后 服务 器 的 主 函 数 可 以 简化 成 : 
gopl.io/ch7/http4 


func main() { 
db := database{"shoes": 50, "socks": 5} 
http.HandleFunc("/list", db.list) 
http.HandleFunc("/price", db.price) 
log.Fatal(http.ListenAndServe("localhost:8000", nil)) 


最 后 ， 一 个 重要 的 提示 : 就 像 我 们 在 1.7 节 中 提 到 的 ，web 服 务 器 在 一 个 新 的 协 程 中 调用 每 一 
个 handler， 所 以 当 handler 获 取 其 它 协 程 或 者 这 个 handler 本 身 的 其 它 请 求 也 可 以 访问 的 变量 
时 一 定 要 使 用 预防 措施 比如 锁 机 制 。 我 们 后 面 的 两 章 中 讲 到 并 发 相关 的 知识 。 


练习 7.11: 增加 额外 的 handler 让 客服 端 可 以 创建 ， 读 取 ， 更 新 和 删除 数据 库 记 录 。 例 如 ， 一 
个 形 如 /update?item=socks&price=6 的 请 求 会 更 新 库存 清单 里 一 个 货品 的 价格 并 且 当 这 个 货 
品 不 存在 或 价格 无 效 时 返回 一 个 错误 值 。 (注意 : 这 个 修改 会 引入 变量 同时 更 新 的 问题 ) 


练习 7.12 : 修改 /list 的 handler 让 它 把 输出 打印 成 一 个 HTML 的 表格 而 不 是 文本 。 
htmltemplate 包 (S4.6) 可 能 会 对 你 有 帮助 。 
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从 本 书 的 开始 ， 我 们 就 已 经 创建 和 使 用 过 神秘 的 预定 义 error 类 型 ， 而 且 没 有 解释 它 究 竞 是 什 
么 。 实 际 上 它 就 是 interface 类 型 ， 这 个 类 型 有 一 个 返回 错误 信息 的 单一 方法 : 


type error interface { 
Error() string 


} 


创建 一 个 error 最 简单 的 方法 就 是 调用 errors.New 了 有 函数 ， 它 会 根据 传 入 的 错误 信息 返回 一 个 新 
的 error。 整 个 errors 包 仅 只 有 4 行 : 

package errors 

func New(text string) error { return &errorString{text} } 

type errorString struct { text string } 


func (e *errorString) Error() string { return e.text } 


承载 errorString 的 类 型 是 一 个 结构 体 而 非 一 个 字符 串 ， 这 是 为 了 保护 它 表 示 的 错误 避免 粗心 

(或 有 意 ) 的 更 新 。 并 且 因为 是 指针 类 型 *errorString 满 足 error 接 口 而 非 errorString 类 型 ， 所 
以 每 个 New 函 数 的 调用 都 分 配 了 一 个 独特 的 和 其 他 错误 不 相同 的 实例 。 我 们 也 不 想 要 重要 的 
error 例 如 io.EOF 和 一 个 刚好 有 相同 错误 消息 的 error 比 较 后 相等 。 


fmt.Println(errors.New("EOF") == errors.New("EOF")) // "false" 


调用 errors.New 函 数 是 非常 稀少 的 ， 因 为 有 一 个 方便 的 封装 函数 fmt.Errorf， 它 还 会 处 理 字 符 
串 格 式 化 。 我 们 曾 多 次 在 第 5 章 中 用 到 它 。 


package fmt 
import "errors" 
func Errorf(format string, args ...interface{}) error { 


return errors.New(Sprintf(format, args...)) 


} 


虽然 *errorString 可 能 是 最 简单 的 错误 类 型 ， 但 远 非 只 有 它 一 个 。 例 如 ，syscall 包 提供 了 Go 语 
言 底层 系统 调用 API。 在 多 个 平台 上 ， 它 定义 一 个 实现 error 接 口 的 数字 类 型 Errno， 并 且 在 
Unix 平 台 上 ，Errno 的 Error 方 法 会 从 一 个 字符 串 表 中 查找 错误 消息 ， 如 下 面 展示 的 这 样 : 


package syscall 


type Errno uintptr // operating system error code 


var errors = [...]string{ 


sil: "Operation not permitted", // EPERM 

2: "no such file or directory", // ENOENT 
3: "no such process", // ESRCH 

CA 


func (e Errno) Error() string { 
if © <= int(e) && int(e) < len(errors) { 
return errors[e] 


} 


return fmt.Sprintf("errno %d", e) 


下 面 的 语句 创建 了 一 个 持 有 Errno 值 为 2 的 接口 值 ， 表 示 POSIX ENOENT 状 况 : 


var err error = syscall.Errno(2) 
fmt.Println(err.Error()) // "no such file or directory" 
fmt.Println(err) // “no such’ fille of danectony™ 


err 的 值 图 形 化 的 呈现 在 图 7.6 中 。 


err 


type syscall.Errno 


Figure 7.6. An interface value holding a sysca11. Errno integer. 





Errno 是 一 个 系统 调用 错误 的 高 效 表示 方式 ， 它 通过 一 个 有 限 的 集合 进行 描述 ， 并 且 它 满足 标 
准 的 错误 接口 。 我 们 会 在 第 7.11 节 了 解 到 其 它 满足 这 个 接口 的 类 型 。 


7.9. 示例 : 表达 式 求 值 


在 本 节 中 ， 我 们 会 构建 一 个 简单 算术 表达 式 的 求 值 器 。 我 们 将 使 用 一 个 接口 Expr 来 表示 Go 语 
言 中 任意 的 表达 式 。 现 在 这 个 接口 不 需要 有 方法 ， 但 是 我 们 后 面 会 为 它 增加 一 些 。 


// An Expr is an arithmetic expression. 


type Expr interface{} 


我 们 的 表达 式 语 言 由 浮 点 数 符号 (小数 点 ) ; 二 元 操作 符 +，-，* > Fels 一 元 操作 符 -x 和 +X ; 
WA pow(x,y) ，sin(x)， 和 sqgrt(x) 的 函数 ; 例如 x 和 pi 的 变量 ; 当然 也 有 括号 和 标准 的 优先 级 运 
算 符 。 所 有 的 值 都 是 float64 类 型 。 这 下 面 是 一 些 表达 式 的 例子 : 


sqrt(A / pi) 
pow(x, 3) + pow(y, 3) 
(E232)0* 50/79 


下 面 的 五 个 具体 类 型 表示 了 具体 的 表达 式 类 型 。Var 类 型 表示 对 一 个 变量 的 引用 。 (我 们 很 快 
会 知道 为 什么 它 可 以 被 输出 。) literal 类 型 表示 一 个 浮 点 型 常量 。unary 和 binary 类 型 表示 有 一 
到 两 个 运算 对 象 的 运算 符 表达 式 ， 这 些 操作 数 可 以 是 任意 的 Expr 类 型 。call 类 型 表示 对 一 个 函 
数 的 调用 ; 我 们 限制 它 的 fn 字段 只 能 是 pow，sin 或 者 sqrt。 


gopl.io/ch7/eval 


// A Nar identifies a variable, e.g., x. 
type Var string 


// A literal is a numeric constant, e.g., 3.141. 
type literal float64 


// A unary represents a unary operator expression, e€.g., X: 
type unary struct { 

op rune // one of '+', '-' 

x Expr 


// A binary represents a binary operator expression, e.g., Xty. 
type binary struct { 

opune /7 TONG Ol ee apn ir w/e 

x, y Expr 


// A call represents a function call expression, e.g., sin(x). 
type call struct { 

fn string // one of "pow", "sin", "sqrt" 

args []Expr 


为 了 计算 一 个 包含 变量 的 表达 式 ， 我 们 需要 一 个 environment 变 量 将 变量 的 名 字 映 射 成 对 应 的 


type Env map[Var]float64 


So eh ee evel ee ， 这 个 方法 会 根据 给 定 的 environment 变 量 返 回 表 
达 式 的 值 。 因 为 每 个 表达 式 都 必须 提供 这 个 方法 ， 我 们 将 它 加 入 到 Expr 接 口中 。 这 个 包 只 会 
AER > Env， 和 Var 类 型 。 调 用 方 不 需要 获取 其 它 的 表达 式 类 型 就 可 以 使 用 这 个 求 值 


o 


ons 


type Expr interface { 
// Eval returns the value of this Expr in the environment env. 
Eval(env Env) float64 


下 面 给 大 家 展示 一 个 具体 的 Eval 方 法 。Var 类 型 的 这 个 方法 对 一 个 environment 变 量 进 行 查找 ， 
如 果 这 个 变量 没有 在 environment 中 定义 过 这 个 方法 会 返回 一 个 零 值 ，literal 类 型 的 这 个 方法 简 
单 的 返回 它 真 实 的 值 。 


func (v Var) Eval(env Env) float64 { 
return env[v] 


func (1 literal) Eval(_ Env) floaté4 { 
return float64(1) 


unary 和 binary 的 Eval 方 法 会 递归 的 计算 它 的 运算 对 象 ， 然 后 将 运算 符 op 作 用 到 它们 上 。 我 们 
不 将 被 零 或 无 穷 数 除 作为 一 个 错误 ， 因 为 它们 都 会 产生 一 个 固定 的 结果 无 限 。 最 后 ，call 的 这 
个 方法 会 计算 对 于 pow，sin， 或 者 sqrt 骂 数 的 参数 值 ， 然 后 调用 对 应 在 math 包 中 的 函数 。 


func (u unary) Eval(env Env) float64 { 
switch u.op { 
casem tus: 
return +u.x.Eval(env) 
case Laik 
return -u.x.Eval(env) 


} 


panic(fmt.Sprintf("unsupported unary operator: %q", u.op)) 


func (b binary) Eval(env Env) float64 { 
switch b.op { 
Case tu: 
return b.x.Eval(env) + b.y.Eval(env) 
case "=": 
return b.x.Eval(env) - b.y.Eval(env) 
Case =: 
return b.x.Eval(env) * b.y.Eval(env) 
case t/i: 
return b.x.Eval(env) / b.y.Eval(env) 
} 
panic(fmt.Sprintf("unsupported binary operator: %q", b.op)) 


func (c call) Eval(env Env) float64 { 
switch c.fn { 
case "pow": 
return math.Pow(c.args[0].Eval(env), c.args[i].Eval(env) ) 
CaSewusalnin: 
return math.Sin(c.args[0].Eval(env) ) 
Cases (Sqines: 
return math.Sqrt(c.args[0].Eval(env) ) 
} 


panic(fmt.Sprintf("unsupported function call: %s", c.fn)) 


一 些 方 法 会 失败 。 例 如 ， 一 个 call 表 达 式 可 能 未 知 的 函数 或 者 错误 的 参数 个 数 。 用 一 个 无 效 的 
运算 符 如 | 或 者 < 去 构建 一 个 unary 或 者 binary 表 达 式 也 是 可 能 会 发 生 的 (尽管 下 面 提 到 的 Parse 
函数 不 会 这 样 做 ) 。 这 些 错误 会 让 Eval 方 法 panic。 其 它 的 错误 ， 像 计算 一 个 没有 在 
environment 变 量 中 出 现 过 的 Var， 只 会 让 Eval 方 法 返回 一 个 错误 的 结果 。 所 有 的 这 些 错误 都 可 
以 通过 在 计算 前 检查 Expr 来 发 现 。 这 是 我 们 接 下 来 要 讲 的 Check 方 法 的 工作 ， 但 是 让 我 们 先 测 
试 Eval 方 法 。 


下 面 的 TestEval 部 数 是 对 evaluator 的 一 个 测试 。 它 使 用 了 我 们 会 在 第 11 章 讲解 的 testing 包 ， 但 
是 现在 知道 调用 t.Errof 会 报告 一 个 错误 就 足够 了 。 这 个 函数 循环 遍历 一 个 表格 中 的 输入 ， 这 个 
表格 中 定义 了 三 个 表达 式 和 针对 每 个 表达 式 不 同 的 环境 变量 。 第 一 个 表达 式 根据 给 定 圆 的 面 
只 A 计算 它 的 半径 ， 第 二 个 表达 式 通 过 两 个 变量 x 和 y 计 算 两 个 立方 体 的 体积 之 和 ， 第 三 个 表达 
式 将 华氏 温度 F 转 换 成 摄氏 度 。 


func TestEval(t *testing.T) { 
tests := []struct { 
expr string 
env Env 
want string 


Ji 
{"sqrt(A / pi)", Env{"A": 87616, "pi": math.Pi}, "167"}, 
HPO Ox. SI) a OW Sp TEnWAR YS ale, /29 
EO OG Sh) ae (OM, EnV Cela UAW Ballo T 
way (E02) ENV EM AG EA Qt: 
TUS A OE 32) ENA Ea er 0 
w5 9 * (E 32)! Env Gures 212}, 110017, 

} 


var prevExpr string 
for _, test := range tests { 
// Print expr only when it changes. 
if test.expr != prevExpr { 
fmt.Printf("\n%s\n", test.expr) 
prevExpr = test.expr 
} 
expr, err := Parse(test.expr) 
if err != nil { 
t.Error(err) // parse error 
continue 
} 
got := fmt.Sprintf("%.6g", expr.Eval(test.env) ) 
fmt.Printf("\t%v => %s\n", test.env, got) 
if got != test.want { 
t.Errorf("%s.Eval() in %v = %q, want %q\n", 
test.expr, test.env, got, test.want) 


对 于 表格 中 的 每 一 条 记录 ， 这 个 测试 会 解析 它 的 表达 式 然 后 在 环境 变量 中 计算 它 ， 输 出 结 
果 。 这 里 我 们 没有 空间 来 展示 Parse 函 数 ， 但 是 如 果 你 使 用 go get 下 载 这 个 包 你 就 可 以 看 到 这 
个 函数 。 


go test(§11.1) 命令 会 运行 一 个 包 的 测试 用 例 : 


$ go test -v gopl.io/ch7/eval 


这 个 -Vy 标识 可 以 让 我 们 看 到 测试 用 例 打 印 的 输出 ; 正常 情况 下 像 这 个 一 样 成 功 的 测试 用 例会 阻 
止 打 印 结 果 的 输出 。 这 里 是 测试 用 例 里 fmt.Printf 语 句 的 输出 : 


sqrt(A / pi) 
map[A:87616 pi:3.141592653589793] => 167 


pow(x, 3) + pow(y, 3) 
map[x:12 y:1] => 1729 
map[x:9 y:10] => 1729 


5/9* (F - 32) 
map[F:-40] => -40 
map[F:32] => 0 
map[F:212] => 100 


幸运 的 是 目前 为 止 所 有 的 输入 都 是 适合 的 格式 ， 但 是 我 们 的 运气 不 可 能 一 直 都 有 。 甚 至 在 解 
释 型 语言 中 ， 为 了 静态 错误 检查 语法 是 非常 常见 的 ; 静态 错误 就 是 不 用 运行 程序 就 可 以 检测 
出 来 的 错误 。 通 过 将 静态 检查 和 动态 的 部 分 分 开 ， 我 们 可 以 快速 的 检查 错误 并 且 对 于 多 次 检 
查 只 执行 一 次 而 不 是 每 次 表达 式 计 算 的 时 候 都 进行 检查 。 


让 我 们 往 Expr 接 口中 增加 另 一 个 方法 。Check 方 法 在 一 个 表达 式 语义 树 检 查 出 静态 错误 。 我 们 
马上 会 说 明 它 的 vars 参 数 。 


type Expr interface { 
Eval(env Env) float64 
// Check reports errors in this Expr and adds its Vars to the set. 


Check(vars map[Var]bool) error 


具体 的 Check 方 法 展示 在 下 面 。literal 和 Var 类 型 的 计算 不 可 能 失败 ， 所 以 这 些 类 型 的 Check 方 
法 会 返回 一 个 nil 值 。 对 于 unary 和 binary 的 Check 方 法 会 首先 检查 操作 符 是 否 有 效 ， 然 后 递归 
的 检查 运算 单元 。 相 似 地 对 于 call 的 这 个 方法 首先 检查 调用 的 函数 是 否 已 知 并 且 有 没有 正确 个 
数 的 参数 ， 然 后 递归 的 检查 每 一 个 参数 。 


func (v Var) Check(vars map[Var]bool) error { 
vars[v] = true 
return nil 


func (literal) Check(vars map[Var]bool) error { 
return nil 


func (u unary) Check(vars map[Var]bool) error { 
if !strings.ContainsRune("+-", u.op) { 
return fmt.Errorf("unexpected unary op %q", u.op) 


} 


return u.x.Check(vars) 


func (b binary) Check(vars map[Var]bool) error { 
if !strings.ContainsRune("+-*/", b.op) { 
return fmt.Errorf("unexpected binary op %q", b.op) 


} 
if err := b.x.Check(vars); err != nil { 
return err 
} 
return b.y.Check(vars) 
} 
func (c call) Check(vars map[Var]bool) error { 
arity, ok := numParams[c. fn] 
if !ok { 


return fmt.Errorf("unknown function %q", c.fn) 
} 
if len(c.args) != arity { 
return fmt.Errorf("call to %s has %d args, want %d", 
c.fn, len(c.args), arity) 


} 
for _, arg := range c.args { 
if err := arg.Check(vars); err != nil { 
return err 
} 
} 


return nil 


var numParams = map[String]int{"pow": 2, "sin": 1, "sqrt": 1} 


我 们 在 两 个 组 中 有 选择 地 列 出 有 问题 的 输入 和 它们 得 出 的 错误 。Parse 函 数 〈 这 里 没有 出 现 ) 
会 报 出 一 个 语法 错误 和 Check 函 数 会 报 出 语义 错误 。 


x % 2 unexpected '%' 


math. Pi unexpected '.' 

Itrue unexpected '!' 

"hello" unexpected '"' 

1og(10) unknown function "log" 

sqrt(1, 2) call to sqrt has 2 args, want 1 


Check 方 法 的 参数 是 一 个 Var 类 型 的 集合 ， 这 个 集合 聚集 从 表达 式 中 找到 的 变量 名 。 为 了 保证 
成 功 的 计算 ， 这 些 变量 中 的 每 一 个 都 必须 出 现在 环境 变量 中 。 从 逻辑 上 讲 ， 这 个 集合 就 是 调 
用 Check 方 法 返回 的 结果 ， 但 是 因为 这 个 方法 是 递归 调用 的 ， 所 以 对 于 Check 方 法 填充 结果 到 
一 个 作为 参数 传 入 的 集合 中 会 更 加 的 方便 。 调 用 方 在 初始 调用 时 必须 提供 一 个 空 的 集合 。 


在 第 3.2 节 中 ， 我 们 绘制 了 一 个 在 编译 器 才 确 定 的 函数 f(x,y)。 现 在 我 们 可 以 解析 ， 检 查 和 计算 

在 字符 囊 中 的 表达 式 ， 我 们 可 以 构建 一 个 在 运行 时 从 容 户 端 接收 表达 式 的 Web 应 用 并 且 它 会 给 

制 这 个 函数 的 表示 的 曲面 。 我 们 可 以 使 用 集合 vars 来 检查 表达 式 是 否 是 一 个 只 有 两 个 变量 ,X 和 

yi} HA 实际 上 是 3 个 ， 因 为 我 们 为 了 方便 会 提供 半径 大 小 F。 并 且 我 们 会 在 计算 前 使 用 

Check 方 法 拒绝 有 格式 问题 的 表达 式 ， 这 样 我 们 就 不 会 在 下 面 函 数 的 40000 个 计算 过 程 
(100x100 个 栅 格 ， 每 一 个 有 4 个 角 ) 重复 这 些 检查 。 


这 个 ParseAndCheck 函 数 混 合 了 解析 和 检查 步骤 的 过 程 : 
gopl.io/ch7/surface 


import "gopl.io/ch7/eval" 


func parseAndCheck(s string) (eval.Expr, error) { 
aap Ss 二 二 wr { 


return nil, fmt.Errorf("empty expression") 


} 

expr, err := eval.Parse(s) 

if err != nil { 
return nil, err 

} 

vars := make(map[eval.Var]bool) 

if err := expr.Check(vars); err != nil { 
return nil, err 

} 

for v := range vars { 
if v != "x" && v != "y" && v t= "r" { 

return nil, fmt.Errorf ("undefined variable: %s", v) 

} 

} 


return expr, nil 


AT a5 web Fl > Pra RAR BLY He T Ok plot ha > RP HARA Fe 
http.HandlerFunc 相 似 的 签名 : 


func plot(w http.Responsewriter, r *http.Request) { 

r.ParseForm() 

expr, err := parseAndCheck(r.Form.Get("expr")) 

if err != nil { 
http.Error(w, "bad expr: "+err.Error(), http.StatusBadRequest ) 
return 

} 

w.Header().Set("Content-Type", "image/svg+xml") 

surface(w, func(x, y float64) float64 { 
r := math.Hypot(x, y) // distance from (0,0) 
return expr.Eval(eval.Env{"x": x, "y": y, ra: r}) 


}) 





| localhost:8000/plot?expr=n x 
é CG f Ù localhost:8000/piot?expr=pow(2, sin(y))"pow(2,sin(x})/12 





EE | jocalhost3000/plot?expr-s x 





Figure 7.7. The surfaces of three functions: (a) sin(-x)*pow(1.5,-r); 
(b) pow(2, sin(y) ) *pow(2, sin(x))/12; (c) sin(x*y/16)/10. 


R P plot RAHAT Fe HEE AHTTP ARP EM RANGA CRUE APDESHES SH 
数 。 这 个 匿名 函数 和 来 自 原来 surface-plotting 程 序 中 的 固定 函数 f 有 相同 的 签名 ， 但 是 它 计算 
一 个 用 户 提 供 的 表达 式 。 环 境 变 量 中 定义 了 x，y 和 半径 r。 最 后 plot 调 用 surface 函 数 ， 它 就 是 
gopl.io/ch3/surface 中 的 主要 函数 ， 修 改 后 它 可 以 接受 plot 中 的 函数 和 输出 io.Writer 作 为 参数 ， 
而 不 是 使 用 国定 的 函数 f 和 os.Stdout。 图 7.7 中 显示 了 通过 程序 产生 的 3 个 曲面 。 


示例 : 表达 式 求 值 271 


练习 7.13 : 为 Expr 增 加 一 个 String 方 法 来 打印 美观 的 语法 树 。 当 再 一 次 解析 的 时 候 ， 检 查 它 
的 结果 是 否 生成 相同 的 语法 树 。 


练习 7.14 : 定义 一 个 新 的 满足 Expr 接 口 的 具体 类 型 并 且 提 供 一 个 新 的 操作 例如 对 它 运算 单元 
中 的 最 小 值 的 计算 。 因 为 Parse 有 子 数 不 会 创建 这 个 新 类 型 的 实例 ， 为 了 使 用 它 你 可 能 需要 直接 
构造 一 个 语法 树 (或 者 继承 parser 接 口 ) 。 

练习 7.15: 编写 一 个 从 标准 输入 中 读 取 一 个 单一 表达 式 的 程序 ， 用 户 及 时 地 提供 对 于 任意 变 
量 的 值 ， 然 后 在 结果 环境 变量 中 计算 表达 式 的 值 。 优 雅 的 处 理 所 有 遇 到 的 错误 。 


练习 7.16: 编写 一 个 基于 web 的 计算 器 程序 。 


7.10. 类 型 断言 


类 型 断言 是 一 个 使 用 在 接口 值 上 的 操作 。 语 法 上 它 看 起 来 像 x.(T) 被 称 为 断言 类 型 ， 这 里 x 表示 
一 个 接口 的 类 型 和 T 表 示 一 个 类 型 。 一 个 类 型 断言 检查 它 操 作对 象 的 动态 类 型 是 否 和 断言 的 类 
型 匹配 。 


这 里 有 两 种 可 能 。 第 一 种 ， 如 果断 言 的 类 型 T 是 一 个 具体 类 型 ， 然 后 类 型 断言 检查 X 的 动态 类 
型 是 否 和 T 相 同 。 如 果 这 个 检查 成 功 了 ， 类 型 断言 的 结果 是 X 的 动态 值 ， 当 然 它 的 类 型 是 T。 换 
多 话说 ， 具 体 类 型 的 类 型 断言 从 它 的 操作 对 象 中 获得 具体 的 值 。 如 果 检 查 失 败 ， 接 下 来 这 个 
操作 会 抛 出 panic。 例 如 : 


var w io.Writer 

w = os.Stdout 

f := w.(*os.File) // success: f == os.Stdout 

c := w.(*bytes.Buffer) // panic: interface holds *os.File, not *bytes.Buffer 


第 二 种 ， 如 果 相 反 断 言 的 类 型 T 是 一 个 接口 类 型 ， 然 后 类 型 断言 检查 是 否 X 的 动态 类 型 满足 T。 
如 果 这 个 检查 成 功 了 ， 动 态 值 没有 获取 到 ; 这 个 结果 仍然 是 一 个 有 相同 类 型 和 值 部 分 的 接口 
值 ， 但 是 结果 有 类 型 T。 换 句 话说， 对 一 个 接口 类 型 的 类 型 断言 改变 了 类 型 的 表述 方式 ， 改 变 
了 可 以 获取 的 方法 集合 〈 通 常 更 大 ) ， 但 是 它 保护 了 接口 值 内 部 的 动态 类 型 和 值 的 部 分 。 

i= 4 


在 下 面 的 第 一 个 类 型 断言 后 ，w 和 rw 都 持 有 os.Stdout 因 此 它们 每 个 有 一 个 动态 类 型 ros.File， 
但 是 变量 w 是 一 个 io.Writer 类 型 只 对 外 公开 出 文件 的 Write 方法 ， 然 而 rw 变量 也 只 公开 它 的 
Read 方 法 。 


var w io.Writer 

w = os.Stdout 

rw := w.(io.Readwriter) // success: *os.File has both Read and Write 
w = new(ByteCounter ) 

rw = w.(io.ReadWriter) // panic: *ByteCounter has no Read method 


如 果断 言 操 作 的 对 象 是 一 个 nil 接 口 值 ， 那 么 不 论 被 断言 的 类 型 是 什么 这 个 类 型 断言 都 会 失 
败 。 我 们 几乎 不 需要 对 一 个 更 少 限制 性 的 接口 类 型 (更 少 的 方法 集合 ) 做 断言 ， 因 为 它 表现 
的 就 像 赋值 操作 一 样 ， 除 了 对 于 nil 接 口 值 的 情况 。 


rw // io.Readwriter is assignable to io.Writer 


rw.(io.Writer) // fails only if rw == nil 


经 常 地 我 们 对 一 个 接口 值 的 动态 类 型 是 不 确定 的 ， 并 且 我 们 更 愿意 去 检验 它 是 否 是 一 些 特定 
的 类 型 。 如 果 类 型 断言 出 现在 一 个 预期 有 两 个 结果 的 赋值 操作 中 ， 例 如 如 下 的 定义 ， 这 个 操 
作 不 会 在 失败 的 时 候 发 生 panic 但 是 代替 地 返回 一 个 额外 的 第 二 个 结果 ， 这 个 结果 是 一 个 标识 


成 功 的 布尔 值 : 


var w io.Writer = os.Stdout 
f, ok := w.(*os.File) // success: ok, f == os.Stdout 
b, ok := w.(*bytes.Buffer) // failure: !ok, b == nil 


第 二 个 结果 常规 地 赋值 给 一 个 命名 为 ok 的 变量 。 如 果 这 个 操作 失败 了 ， 那 么 ok 就 是 false 值 ， 
第 一 个 结果 等 于 被 断言 类 型 的 零 值 ， 在 这 个 例子 中 就 是 一 个 nil 的 *bytes.Buffer 类 型 。 


这 个 ok 结果 经 常 立 即 用 于 决定 程序 下 面 做 什么 。if 语 多 的 扩展 格式 让 这 个 变 的 很 简洁 : 


if f, ok := w.(*os.File); ok { 
He oa MS Pec 


当 类 型 断言 的 操作 对 象 是 一 个 变量 ， 你 有 时 会 看 见 原来 的 变量 名 重用 而 不 是 声明 一 个 新 的 本 
地 变量 ， 这 个 重用 的 变量 会 覆盖 原来 的 值 ， 如 下 面 这 样 : 


if w, ok := w.(*os.File); ok { 
H aa a UOA Moar 


7.11. 基于 类 型 断言 区 别 错误 类 型 


思考 在 0S 包 中 文件 操作 返回 的 错误 集合 。l/O 可 以 因为 任何 数量 的 原因 失败 ， 但 是 有 三 种 经 党 
的 错误 必须 进行 不 同 的 处 理 : 文件 已 经 存在 (对 于 创建 操作 ) ， 找 不 到 文件 ee 取 操 
VE) ， 和 权限 拒绝 。oSs 包 中 提供 了 这 三 个 帮助 函数 来 对 给 定 的 错误 值 表示 的 失败 进行 分 类 : 


package os 


func IsExist(err error) bool 
func IsNotExist(err error) bool 
func IsPermission(err error) bool 


对 这 些 判 断 的 一 个 缺乏 经 验 的 实现 可 能 会 去 检查 错误 消息 是 否 包 含 了 特定 的 子 字符 囊 ， 


func IsNotExist(err error) bool { 
// NOTE: not robust! 
return strings.Contains(err.Error(), "file does not exist") 


但 是 处 理 |/O 错 误 的 逻辑 可 能 一 个 和 另 一 个 平台 非常 的 不 同 ， 所 以 这 种 方案 并 不 健壮 并 且 对 相 
同 的 失败 可 能 会 报 出 各 种 不 同 的 错误 消息 。 在 测试 的 过 程 中 ， 通 过 检查 错误 消息 的 子 字符 串 
来 保证 特定 的 函数 以 期 望 的 方式 失败 是 非常 有 用 的 ， 但 对 于 线 上 的 代码 是 不 够 的 。 


一 个 更 可 靠 的 方式 是 使 用 一 个 专门 的 类 型 来 描述 结构 化 的 错误 。os 包 中 定义 了 一 个 PathError 
类 型 来 描述 在 文件 路 径 操 作 中 涉及 到 的 失败 ， 像 Open 或 者 Delete 操 作 , 并 且 定 义 了 一 个 叫 
LinkError 的 变 体 来 描述 涉及 到 两 个 文件 路 径 的 操作 ， 像 Symlink 和 Rename。 这 下 面 是 
os.PathError : 


package os 


// PathError records an error and the operation and file path that caused it. 
type PathError struct { 

Op string 

Path string 

Err error 


} 


func (e *PathError) Error() string { 
return e op + " " + e.Path + ": " + e.Err.Error() 


} 


大 多 数 调用 方 都 不 知道 PathError 并 且 通 过 调用 错误 本 身 的 Error 方 法 来 统一 处 理 所 有 的 错误 。 
尽管 PathError 的 Error 方 法 简单 地 把 这 些 字段 连接 起 来 生成 错误 消息 ，PathError 的 结构 保护 了 
内 部 的 错误 组 件 。 调 用 方 需要 使 用 类 型 断言 来 检测 错误 的 具体 类 型 以 便 将 一 种 失败 和 另 一 种 
区 分 开 ; 具体 的 类 型 比 字 符 串 可 以 提供 更 多 的 细节 。 


_, err := os.Open("/no/such/file") 

fmt.Printin(err) // "open /no/such/file: No such file or directory" 
fmt.Printf("%#v\n", err) 

// Output: 

// &0S.PathError{Op:"open", Path:"/no/such/file", Err:0x2} 


这 就 是 三 个 帮助 函数 是 怎么 工作 的 。 例 如 下 面 展示 的 ISNotExist， 它 会 报 出 是 否 一 个 错误 和 
syscall.ENOENT(S7.8) 或 者 和 有 名 的 错误 os.ErrNotExist 相 等 (可 以 在 $5.4.2 中 找到 io.EOF) ; 
或 者 是 一 个 *PathError， 它 内 部 的 错误 是 syscall.ENOENT 和 os.ErrNotExist 其 中 之 一 。 


import ( 
Sennons. 
"syscall" 
) 


var ErrNotExist = errors.New("file does not exist") 


// ISNotExist returns a boolean indicating whether the error is known to 
// report that a file or directory does not exist. It is satisfied by 
// ErrNotExist as well as some syscall errors. 
func IsNotExist(err error) bool { 
if pe, ok := err.(*PathError); ok { 
err = pe.Err 


} 


return err == syscall.ENOENT || err == ErrNotExist 


下 面 这 里 是 它 的 实际 使 用 : 


_, err := os.Open("/no/such/file") 
fmt.Println(os.IsNotExist(err)) // "true" 


如 果 错 误 消 息 结合 成 一 个 更 大 的 字符 串 ， 当 然 PathError 的 结构 就 不 再 为 人 所 知 ， 例 如 通过 一 
个 对 fmt.Errorf 鸥 数 的 调用 。 区 别 错误 通常 必须 在 失败 操作 后 ， 错 误 传 回调 用 者 前 进行 。 


7.12. 通过 类 型 断言 询问 行为 


下 面 这 段 罗 辑 和 net/http 包 中 web 服务 器 负责 写 入 HTTP 关 字段 (例如 : "Content- 
type:text/html) 的 部 分 相似 。io. A 型 的 变量 w 代 表 HTTP 响 应 ; SACHF PRA 
被 发 送 到 某 个 人 的 web 浏 览 器 上 。 


func writeHeader(w io.Writer, contentType string) error { 
if _, err := w.Write([]byte("Content-Type: ")); err != nil { 
return err 


} 
if _, err := w.Write([]byte(contentType)); err != nil { 
return err 


} 
Ws 


因为 Write 方法 需要 传 入 一 个 byte 切 片 而 我 们 希望 写 入 的 值 是 一 个 字符 串 ， 所 以 我 们 需要 使 用 
[lbyte(...) 进 行 转换 。 这 个 转换 分 配 内 存 并 且 做 一 个 找 贝 ， 但 是 ee 
a 是 一 个 web 服 务 器 ee 个 内 存 分 
使 服务 器 的 速度 这 里 我 们 可 以 避免 掉 内 存 分 


这 个 io.Writer 接 口 告 诉 我 们 关于 w 持 有 的 具体 类 型 的 唯一 东西 : 就 是 可 以 向 它 写 入 字 节 切片 。 
如 果 我 们 回顾 net/http 包 中 的 内 幕 ， Poun 首 在 这 个 程序 中 的 w 变 量 持 有 的 动态 类 ae 个 
允许 字符 串 高 效 写 入 的 WriteString 方 法 ; 这 个 方法 会 避免 去 分 配 一 个 零 时 的 拷贝 。 (这 可 能 像 
在 黑夜 中 射击 一 样 ， 但 是 许多 满足 io.Writer 接 口 的 重要 类 型 同时 也 有 WriteString 方 法 ， 包 括 
*bytes.Buffer > *os.File 和 *bufio.Writer 。) 


我 们 不 能 对 任意 io.Writer 类 型 的 变量 WwW， 假 设 它 也 拥有 WriteString 方 法 。 但 是 我 们 可 以 定义 一 
个 只 有 这 个 方法 的 新 接口 并 且 使 用 类 型 断言 来 检测 是 否 W 的 动态 类 型 满足 这 个 新 接口 。 


// writeString writes s to w. 
// If w has a WriteString method, it is invoked instead of w.Write. 
func writeString(w io.Writer, s string) (n int, err error) { 
type stringWriter interface { 
WriteString(string) (n int, err error) 


} 
if sw, ok := w.(stringWriter); ok { 
return sw.WriteString(s) // avoid a copy 
} 
return w.Write([]byte(s)) // allocate temporary copy 
} 
func writeHeader(w io.Writer, contentType string) error { 
if _, err := writeString(w, "Content-Type: "); err != nil { 
return err 
} 
if _, err := writeString(w, contentType); err != nil { 
return err 
// 


为 了 避免 重复 定义 ， 我 们 将 这 个 检查 移入 到 一 个 实用 工具 函数 writeString 中 ， 但 是 它 太 有 用 了 
以 致 标准 库 将 它 作为 jo.WriteString 函 数 提供 。 这 是 向 一 个 io.Writer 接 口 写 入 字符 串 的 推荐 方 
法 。 


这 个 例子 的 神奇 之 处 在 于 没有 定义 了 WriteString 方 法 的 标准 接口 和 没有 指定 它 是 一 个 需要 行为 
的 标准 接口 。 而 且 一 个 具体 类 型 只 会 通过 它 的 方法 决定 它 是 否 满 足 stringWriter 接 口 ， 而 不 是 
任何 它 和 这 个 接口 类 型 表明 的 关系 。 它 的 意思 就 是 上 面 的 技术 依赖 于 一 个 假设 ; 这 个 假设 就 
是 ， 如 果 一 个 类 型 满足 下 面 的 这 个 接口 ， 然 后 WriteString(s) 就 方法 必须 和 Write([]byte(s)) 有 相 
同 的 效果 © 


interface { 
io.Writer 
WriteString(s string) (n int, err error) 


尽管 io.WriteString 记 录 了 它 的 假设 ， 但 是 调用 它 的 函数 极 少 有 可 能 会 去 记录 它们 也 做 了 同样 
的 假设 。 定 义 一 个 特定 类 型 的 方法 隐 式 地 获取 了 对 特定 行为 的 协约 。 对 于 Go 语言 的 新 手 ， 特 
别 是 那些 来 自 有 强 类 型 语言 使 用 背景 的 新 手 ， 可 能 会 发 现 它 缺乏 显 式 的 意图 令 人 感到 混乱 ， 
但 是 在 实战 的 过 程 中 这 几乎 不 是 一 个 问题 。 除 了 空 接口 interface 人 }, 接 口 类 型 很 少 意外 巧合 地 被 
实现 。 

上 面 的 writeString 有 函数 使 用 一 个 类 型 断言 来 知道 一 个 普遍 接口 类 型 的 值 是 否 满足 一 个 更 加 具体 


的 接口 类 型 ; 并 且 如 果 满 足 ， 它 会 使 用 这 个 更 具体 接口 的 行为 。 这 个 技术 可 以 被 很 好 的 使 用 
不 论 这 个 被 询问 的 接口 是 一 个 标准 的 如 io.ReadWriter 或 者 用 户 定义 的 如 stringWriter 。 
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fmt.Fprintf 内 部 ， 有 一 个 将 单个 操作 对 象 转 换 成 一 个 字符 串 的 步骤 ， 像 下 面 这 样 : 


package fmt 


func formatOneValue(x interface{}) string { 
if err, ok := x.(error); ok { 
return err.Error() 
} 
if str, ok := x.(Stringer); ok { 
return str.String() 


} 


al other VAY Seo 


如 果 x 满 足 这 个 两 个 接口 类 型 中 的 一 个 ， 具 体 满足 的 接口 决定 对 值 的 格式 化 方式 。 如 果 都 不 满 
足 ， 默 认 的 case 或 多 或 少 会 统一 地 使 用 反射 来 处 理 所 有 的 其 它 类 型 ; 我 们 可 以 在 第 12 章 知道 
具体 是 怎么 实现 的 。 


再 一 次 的 ， 它 假设 任何 有 String 方 法 的 类 型 满足 fmt.Stringer 中 约定 的 行为 ， 这 个 行为 会 返回 一 
个 适合 打印 的 字符 串 。 


7.13. 类 型 开关 


接口 被 以 两 种 不 同 的 方式 使 用 。 在 第 一 个 方式 中 ， 以 io.Reader > io.Writer > fmt.Stringer > 
sort.Interface，http.Handler， 和 error 为 典型 ， 一 个 接口 的 方法 表达 了 实现 这 个 接口 的 具体 类 
型 间 的 相思 性 ， 但 是 隐藏 了 代表 的 细节 和 这 些 具体 类 型 本 身 的 操作 。 重 点 在 于 方法 上 ， 而 不 
是 具体 的 类 型 上 。 


第 二 个 方式 利用 一 个 接口 值 可 以 持 有 各 种 具体 类 型 值 的 能 力 并 且 将 这 个 接口 认为 是 这 些 类 型 
的 union (HE) 。 类 型 断言 用 来 动态 地 区 别 这 些 类 型 并 且 对 每 一 种 情况 都 不 一 样 。 在 这 个 方 
式 中 ， 重 点 在 于 有 具体 的 类 型 满足 这 个 接口 ， 而 不 是 在 于 接口 的 方法 (如 果 它 确实 有 一 些 的 
话 ) ， 并 且 没 有 任何 的 信息 隐藏 。 我 们 将 以 这 种 方式 使 用 的 接口 描述 为 discriminated 

unions (TÈ RKA) ° 


如 果 你 熟悉 面向 对 象 编程 ， 你 可 能 会 将 这 两 种 方式 当 作 是 subtype polymorphism ( 子 类 型 多 
态 ) 和 ad hoc polymorphism ( 非 参数 多 态 ) ， 但 是 你 不 需要 去 记 住 这 些 术语 。 对 于 本 章 剩 下 
的 部 分 ， 我 们 将 会 呈现 一 些 第 二 种 方式 的 例子 。 


和 其 它 那些 语言 一 样 ，Go 语 言 查 询 一 个 SQL 数据 库 的 API 会 干净 地 将 查询 中 国定 的 部 分 和 变 
化 的 部 分 分 开 。 一 个 调用 的 例子 可 能 看 起 来 像 这 样 : 


import "database/sql" 


func listTracks(db sql.DB, artist string, minYear, maxYear int) { 
result, err := db.Exec( 
"SELECT * FROM tracks WHERE artist = ? AND ? <= year AND year <= ?", 
artist, minYear, maxYear) 
HI nse 


Exec 方 法 使 用 SQL 字 面 量 葵 换 在 查询 字符 囊 中 的 每 个 ?9' ; SQL 字面 量 表示 相应 参数 的 值 ， 它 
有 可 能 是 一 个 布尔 值 ， 一 个 数字 ， 一 个 字符 事 ， 或 者 nil 空 值 。 用 这 种 方式 构造 查询 可 以 帮助 
避免 SQL 注 入 攻击 ; 这 种 攻击 就 是 对 手 可 以 通过 利用 输入 内 容 中 不 正确 的 引文 来 控制 查询 语 
铭 。 在 EXxec 函 数 内 部 ， 我 们 可 能 会 找到 像 下 面 这 样 的 一 个 函数 ， 它 会 将 每 一 个 参数 值 转换 成 
它 的 SQL 字面 量 符号 。 


func sqlQuote(x interface{}) string { 
if x == nil { 
return "NULL" 
} else if _, ok := x.(int); ok { 
return fmt.Sprintf("%d", x) 
} else if _, ok := x.(uint); ok { 
return fmt.Sprintf("%d", x) 
} else if b, ok := x.(bool); ok { 
stip [oy af 
return "TRUE" 
} 
return "FALSE" 
} else if s, ok := x.(string); ok { 
return sqlQuoteString(s) // (not shown) 
} else { 
panic(fmt.Sprintf("unexpected type %T: %v", x, X)) 


switch 语 句 可 以 简化 if-else 链 ， 如 果 这 个 else 链 对 一 连 串 值 做 相等 测试 。 一 个 相似 的 type 
switch (类 型 开关 ) 可 以 简化 类 型 断言 的 -else 链 。 


在 它 最 简单 的 形式 中 ， 一 个 类 型 开关 像 普通 的 Switch 语句 一 样 ， 它 的 运算 对 象 是 x.(type) 一 它 
使 用 了 关键 词 字面 量 type 一 并 且 每 个 case 有 一 到 多 个 类 型 。 一 个 类 型 开关 基于 这 个 接口 值 的 
动态 类 型 使 一 个 多 路 分 支 有 效 。 这 个 nil 的 case 和 fx == nil 匹 配 ， 并 且 这 个 default 的 case 和 如 
果 其 它 case 都 不 匹配 的 情况 匹配 。 一 个 对 sqlQuote 的 类 型 开关 可 能 会 有 这 些 case : 


switch x.(type) { 
case nil: A 
case int, uint: // ... 


case bool: i ee 
case string: Life ers 
default: i ie 


和 (§1.8) 中 的 普通 switch 语 句 一 样 ， 每 一 个 case 会 被 顺序 的 进行 考虑 ， 并 且 当 一 个 匹配 找到 
时 ， 这 个 case 中 的 内 容 会 被 执行 。 当 一 个 或 多 个 case 类 型 是 接口 时 ，case 的 顺序 就 会 变 得 很 
重要 ， 因 为 可 能 会 有 两 个 case 同 时 匹配 的 情况 。default case 相 对 其 它 case 的 位 置 是 无 所 谓 
的 。 它 不 会 允许 落空 发 生 。 


注意 到 在 原来 的 函数 中 ， 对 于 bool 和 string 情 况 的 逻辑 需要 通过 类 型 断言 访问 提取 的 值 。 因 为 
这 个 做 法 很 典型 ， 类 型 开关 语句 有 一 个 扩展 的 形式 ， 它 可 以 将 提取 的 值 绑 定 到 一 个 在 每 个 
case 范 围 内 的 新 变量 。 


switch x = x. (type) { 7* ... *7 } 


这 里 我 们 已 经 将 新 的 变量 也 命名 为 X ; 和 类 型 断言 一 样 ， 重 用 变量 名 是 很 常见 的 。 和 一 个 
Switch 语句 相似 地 ， 一 个 类 型 开关 隐 式 的 创建 了 一 个 语言 块 ， 因 此 新 变量 X 的 定义 不 会 和 外 面 
块 中 的 X 变 量 冲 突 。 每 一 个 case 也 会 隐 式 的 创建 一 个 单独 的 语言 块 。 


使 用 类 型 开关 的 扩展 形式 来 重 写 sqlQuote 函 数 会 让 这 个 函数 更 加 的 清晰 : 


func sqlQuote(x interface{}) string { 
switch x := x.(type) { 
case nil: 
return "NULL" 
case int, uint: 
return fmt.Sprintf("%d", x) // x has type interface{} here. 
case bool: 
ably R af 
return "TRUE" 
} 
return "FALSE" 
case string: 
return sqlQuoteString(x) // (not shown) 
default: 
panic(fmt.Sprintf( "unexpected type %T: %v", x, Xx)) 


在 这 个 版 本 的 函数 中 ， 在 每 个 单一 类 型 的 case 内 部 ， 变 量 Xx 和 这 个 case 的 类 型 相同 。 例 如 ， 变 
量 Xx 在 bool 的 case 中 是 bool 类 型 和 string 的 case 中 是 string 类 型 。 在 所 有 其 它 的 情况 中 ， 变 量 Xx 是 
switch 运 算 对 象 的 类 型 (接口 ) ;在 这 个 例子 中 运算 对 象 是 一 个 interface{}。 当 多 个 case 需 要 


相同 的 操作 时 ， 比 如 int 和 uint 的 情况 ， 类 型 开关 可 以 很 容易 的 合并 这 些 情 况 。 


尽管 sqlQuote 接 受 一 个 任意 类 型 的 参数 ， 但 是 这 个 函数 只 会 在 它 的 参数 匹配 类 型 开关 中 的 一 
个 case 时 运行 到 结束 ; 其 它 情况 的 它 会 panic 出 "unexpected type” 消 息 。 虽 然 x 的 类 型 是 
interface{}， 但 是 我 们 把 它 认为 是 一 个 int，uint，bool > string > #nil44 4 discriminated 


union (可 识别 联合 ) 


7.14, 示例 : 基于 标记 的 XML 解码 


第 4.5 章 节 展 示 了 如 何 使 用 encoding/json 包 中 的 Marshal 和 Unmarshal 函 数 来 将 JSON 文 档 转 换 
成 Go 语言 的 数据 结构 。encoding/xml 包 提供 了 一 个 相似 的 API。 当 我 们 想 构造 一 个 文档 树 的 表 
示 时 使 用 encoding/xml 包 会 很 方便 ， 但 是 对 于 很 多 程序 并 不 是 必须 的 。encoding/xml 包 也 提供 
了 一 个 更 低层 的 基于 标记 的 API 用 于 XML 解码 。 在 基于 标记 的 样式 中 ， 解 析 器 消费 输入 和 产生 
一 个 标记 流 ; 四 个 主要 的 标记 类 型 一 StartElement，EndElement，CharData， 和 Comment 一 
每 一 个 都 是 encoding/xml 包 中 的 有 具体 类 型 。 每 一 个 对 (*xml.Decoder).Token 的 调用 都 返回 一 个 
标记 。 


这 里 显示 的 是 和 这 个 API 相 关 的 部 分 : 
encoding/xml 


package xml 


type Name struct { 
Local string // e.g., “Title” of “ad" 


type Attr struct { // e.g., name="value" 
Name Name 
Value string 


// A Token includes StartElement, EndElement, CharData, 
// and Comment, plus a few esoteric types (not shown). 
type Token interface{} 
type StartElement struct { // e.g., <name> 

Name Name 

Attr []Attr 


} 

type EndElement struct { Name Name } // e.g., </name> 

type CharData []byte // e.g., <p>CharData</p> 
type Comment []byte // e.g., <!-- Comment --> 
type Decoder struct{ /* ... */ } 


func NewDecoder(io.Reader) *Decoder 
func (*Decoder) Token() (Token, error) // returns next Token in sequence 


这 个 没有 方法 的 Token 接 口 也 是 一 个 可 识别 联合 的 例子 。 传 统 的 接口 如 io.Reader 的 目的 是 隐 
藏 满足 它 的 具体 类 型 的 细节 ， 这 样 就 可 以 创造 出 新 的 实现 ; 在 这 个 实现 中 每 个 具体 类 型 都 被 
统一 地 对 待 。 相 反 ， 满 足 可 识别 联合 的 有 具体 类 型 的 集合 被 设计 确定 和 暴露 ， 而 不 是 隐藏 。 可 
识别 的 联合 类 型 几乎 没有 方法 ; 操作 它们 的 函数 使 用 一 个 类 型 开关 的 case 集 合 来 进行 表述 ; 
这 个 case 集 合 中 每 一 个 case 中 有 不 同 的 逻辑 。 


下 面 的 xmlselect 程 序 获取 和 打印 在 一 个 XML 文档 树 中 确定 的 元 素 下 找到 的 文本 。 使 用 上 面 的 
API， 它 可 以 在 输入 上 一 次 完成 它 的 工作 而 从 来 不 要 具体 化 这 个 文档 树 。 


gopl.io/ch7/xmiselect 


// Xmlselect prints the text of selected elements of an XML document. 
package main 


import ( 
"encoding/xml" 
pmt 
Nao" 
Nog" 
SI 全 SS 让 
) 
func main() { 
dec := xml.NewDecoder(os.Stdin) 
var stack []string // stack of element names 
for { 
tok, err := dec.Token() 
if err == 10.E0F { 
break 
} else if err != nil { 
fmt.Fprintf(os.Stderr, "xmlselect: %v\n", err) 
os.Exit(1) 
} 


switch tok := tok.(type) { 
case xml.StartElement: 

stack = append(stack, tok.Name.Local) // push 
case xml.EndElement: 

stack = stack[:len(stack)-1] // pop 
case xml.CharData: 

if containsAll(stack, os.Args[i:]) { 

fmt.Printf("%s: %s\n", strings.Join(stack, " "), tok) 


// containsAll reports whether x contains the elements of y, in order. 
func containsAll(x, y []string) bool { 
for len(y) <= len(x) { 
if len(y) == 0 { 
return true 


} 

if x[0] == y[o] { 
y = y[1:] 

} 

x = x[1:] 


return false 
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每 次 遇 到 EndElement 时 ， 它 将 名 称 从 这 个 栈 中 推出 。 这 个 API 保 证 了 StartElement 和 
EndElement 的 序列 可 以 被 完全 的 匹配 ， 其 至 在 一 个 糟糕 的 文档 格式 中 。 注 释 会 被 忽略 。 当 
xmlselect 遇 到 一 个 CharData 时 ， 只 有 当 栈 中 有 序 地 包含 所 有 通过 命令 行 参数 传 入 的 元 素 名 称 
时 它 才 会 输出 相应 的 文本 。 


下 面 的 命令 打印 出 任意 出 现在 两 层 div 元 素 下 的 h2 元 素 的 文本 。 它 的 输入 是 XML 的 说 明文 档 ， 
并 且 它 自己 就 是 XML 文档 格式 的 。 


$ go build gopl.io/chi/fetch 
$ ./fetch http://www.w3.org/TR/2006/REC-xm111-20060816 | 
./xmlselect div div h2 


html body div div h2: 1 Introduction 

html body div div h2: 2 Documents 

html body div div h2: 3 Logical Structures 

html body div div h2: 4 Physical Structures 

html body div div h2: 5 Conformance 

html body div div h2: 6 Notation 

html body div div h2: A References 

html body div div h2: B Definitions for Character Normalization 


练习 7.17 : 扩展 Xmlselect 程 序 以 便 让 元 素 不 仅仅 可 以 通过 名 称 选 择 ， 也 可 以 通过 它们 CSS 样 
式 上 属性 进行 选择 ; 例如 一 个 像 这 样 


的 元 素 可 以 通过 匹配 id 或 者 class 同 时 还 有 它 的 名 称 来 进行 选择 。 


练习 7.18 : 使 用 基于 标记 的 解码 API， 编 写 一 个 可 以 读 取 任 意 XML 文 档 和 构造 这 个 文档 所 代 
表 的 普通 节点 树 的 程序 。 节 点 有 两 种 类 型 : CharData 节 点 表示 文本 字符 串 ， 和 Element 节 点 
表示 被 命 eee 。 每 一 个 元 素 节点 有 一 个 字 节点 的 切片 。 


你 可 能 发 现下 面 的 定义 会 对 你 有 帮助 。 


import "encoding/xml" 
type Node interface{} // CharData or *Element 
type CharData string 
type Element struct { 
Type xml .Name 


Attr []xml.Attr 
Children []Node 


示例 ; 基于 标记 的 XML 解码 
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7.15, 一 些 建议 


当 设 计 一 个 新 的 包 时 ， 新 的 Go 程序 员 总 是 通过 创建 一 个 接口 的 集合 开始 和 后 面 定 义 满足 它们 
的 具体 类 型 。 这 种 方式 的 结果 就 是 有 很 多 的 接口 ， 它 们 中 的 每 一 个 仅 只 有 一 个 实现 。 不 要 再 
这 么 做 了 。 这 种 接口 是 不 必要 的 抽象 ; 它们 也 有 一 个 运行 时 损耗 。 你 可 以 使 用 导出 机 制 (§6.6) 
来 限制 一 个 类 型 的 方法 或 一 个 结构 体 的 字段 是 否 在 包 外 可 见 。 接 口 只 有 当 有 两 个 或 两 个 以 上 
的 具体 类 型 必须 以 相同 的 方式 进行 处 理 时 才 需 要 。 


当 一 个 接口 只 被 一 个 单一 的 具体 类 型 实现 时 有 一 个 例外 ， 就 是 由 于 它 的 依赖 ， 这 个 具体 类 型 
不 能 和 这 个 接口 存在 在 一 个 相同 的 包 中 。 这 种 情况 下 ， 一 个 接口 是 解 耦 这 两 个 包 的 一 个 好 好 
因为 在 Go 语言 中 只 有 当 两 个 或 更 多 的 类 型 实现 一 个 接口 时 才 使 用 接口 ， 它 们 必定 会 从 任意 特 
定 的 实现 细节 中 抽象 出 来 。 结 果 就 是 有 更 少 和 更 简单 方法 (经常 和 io.Writer 或 fmt.Stringer— 
样 只 有 一 个 ) 的 更 小 的 接口 。 当 新 的 类 型 出 现时 ， 小 的 接口 更 容易 满足 。 对 于 接口 设计 的 一 
个 好 的 标准 就 是 ask only for what you need (只 考虑 你 需要 的 东西 ) 


我 们 完成 了 对 methods 和 接口 的 学 习 过 程 。Go 语 言 良 好 的 支持 面向 对 象 风 格 的 编程 ， 但 只 不 
是 说 你 仅仅 只 能 使 用 它 。 不 是 任何 事物 都 需要 被 当做 成 一 个 对 象 ; 独立 的 函数 有 它们 自己 的 
用 处 ， 未 封装 的 数据 类 型 也 是 这 样 。 同 时 观察 到 这 两 个 ， 在 本 书 的 前 五 章 的 例子 中 没有 调用 
超过 两 打 方法 ， 像 input.Scan， 与 之 相反 的 是 普遍 的 函数 调用 如 fmt.Printf 。 


第 八 章 Goroutines 和 Channels 


并 发 程序 指 同时 进行 多 个 任务 的 程序 ， 随 着 硬件 的 发 展 ， 并 发 程序 变 得 越 来 越 重 要 。VVeb 服 
务 器 会 一 次 处 理 成 千 上 万 的 请 求 。 平 板 电脑 和 手机 app 在 泻 染 用 户 画 面 同时 还 会 后 台 执行 各 种 
计算 任务 和 网 络 请 求 。 即 使 是 传统 的 批 处 理 问 题 -- 读 取 数 据 ， 计 算 ， 写 输出 -- 现 在 也 会 用 并 发 
来 隐藏 掉 I/O 的 操作 延迟 以 充分 利用 现代 计算 机 设备 的 多 个 核心 。 计 算 机 的 性 能 每 年 都 在 以 非 
线性 的 速度 增长 。 


0 语言 中 的 并 发 程序 可 以 用 两 种 手段 来 实现 。 本 章 讲解 goroutine 和 channel， 其 支持 “顺序 通 
pee (communicating sequential processes) 或 被 简称 为 CSP。CSP 是 一 种 现代 的 并 发 编程 
模型 ， 在 这 种 编程 模型 中 值 会 在 不 同 的 运行 实例 (goroutine) 中 传递 ， 尽 管 大 多 数 情况 下 仍然 是 
被 限制 在 单一 实例 中 。 第 9 章 履 盖 更 为 传统 的 并 发 模型 : 多 线程 共享 内 存 ， 如 果 你 在 其 它 的 主 
流 语言 中 写 过 并 发 程序 的 话 可 能 会 更 熟悉 一 些 。 第 9 章 也 会 深入 介绍 一 些 并 发 程序 带 来 的 风险 
和 陷阱 。 


尽管 Go 对 并 发 的 支持 是 众多 强力 特性 之 一 ， 但 跟踪 调试 并 发 程序 还 是 很 困难 ， 在 线性 程序 中 
形成 的 直觉 往往 还 会 使 我 们 误 入 歧途 。 如 果 这 是 读者 第 一 次 接触 并 发 ， 推 荐 稍微 多 花 一 些 时 
间 来 思考 这 两 个 章节 中 的 样 例 。 


8.1. Goroutines 


在 Go 语言 中 ， 每 一 个 并 发 的 执行 单元 叫 作 一 个 goroutine。 设 想 这 里 的 一 个 程序 有 两 个 函数 ， 
一 个 函数 做 计算 ， 另 一 个 输出 结果 ， 假 设 两 个 函数 没有 相互 之 间 的 调用 关系 。 一 个 线性 的 程 
序 会 先 调用 其 中 的 一 个 函数 ， 然 后 再 调用 另 一 个 。 如 果 程 序 中 包含 多 个 goroutine， 对 两 个 函 
数 的 调用 则 可 能 发 生 在 同一 时 刻 。 马 上 就 会 看 到 这 样 的 一 个 程序 。 


如 果 你 使 用 过 操作 系统 或 者 其 它 语言 提供 的 线程 ， 那 么 你 可 以 简单 地 把 goroutine 类 比 作 一 个 
线程 ， 这 样 你 就 可 以 写 出 一 些 正确 的 程序 了 。goroutine 和 线程 的 本 质 区 别 会 在 9.8 节 中 讲 。 


当 一 个 程序 启动 时 ， 其 主 函 数 即 在 一 个 单独 的 goroutine 中 运行 ， 我 们 叫 它 main goroutine。 新 
的 goroutine 会 用 go 语句 来 创建 。 在 语法 上 ，go 语 句 是 一 个 普通 的 函数 或 方法 调用 前 加 上 关键 
字 go。g0o 语 句 会 使 其 语句 中 的 函数 在 一 个 新 创建 的 goroutine 中 运行 。 而 go 语句 本 身 会 迅速 地 


F() // call f(); wait for it to return 


go f() // create a new goroutine that calls f(); don't wait 


下 面 的 例子 ，main goroutine 将 计算 菲 波 那 契 数列 的 第 45 个 元 素 值 。 由 于 计算 函数 使 用 低 效 的 
递归 ， 所 以 会 运行 相当 长 时 间 ， 在 此 期 间 我 们 想 让 用 户 看 到 一 个 可 见 的 标识 来 表明 程序 依然 
在 正常 运行 ， 所 以 来 做 一 个 动画 的 小 图 标 : 


gopl.io/ch8/spinner 


func main() { 
go spinner(i00 * time.Millisecond) 
const n = 45 
fibN := fib(n) // slow 
fmt.Printf("\rFibonacci(%d) = %d\n", n, fibN) 
} 


func spinner(delay time.Duration) { 
om {ft 
Ol a7 te GS rangen SN 
fmt.Printf("\r%ce", r) 
time.Sleep(delay) 


} 
} 
} 
func fib(x int) int { 
ali ASAN 
return x 
} 


return fib(x-1) + fib(x-2) 


w 


动画 显示 了 几 秒 之 后 ，fib(45) 的 调用 成 功 地 返回 ， 并 且 打印 结果 : 


Fibonacci(45) = 1134903170 
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数 退 出 或 者 直接 终止 程序 之 外 ， 没 有 其 它 的 编程 方法 能 够 让 一 个 goroutine 来 打 断 另 一 个 的 执 
行 ， 但 是 之 后 可 以 看 到 一 种 方式 来 实现 这 个 目的 ， 通 过 goroutine 之 间 的 通信 来 让 一 个 
goroutine 请 求 其 它 的 goroutine， 并 被 请 求 的 goroutine 自 行 结 束 执 行 。 


留意 一 下 这 里 的 两 个 独立 的 单元 是 如 何 进行 组 合 的 ，spinning 和 菲 波 那 契 的 计算 。 分 别 在 独立 
的 函数 中 ， 但 两 个 函数 会 同时 执行 。 


8.2. 示例 : 并 发 的 Clock 服 务 


网 络 编程 是 并 发 大 显 身手 的 一 个 领域 ， 由 于 服务 器 是 最 典型 的 需要 同时 处 理 很 多 连接 的 程 
序 ， 这 些 连接 一 般 来 自 远 彼此 独立 的 客户 端 。 在 本 小 节 中 ， 我 们 会 讲解 go 语言 的 net 包 ， 这 个 
包 提供 编写 一 个 网 络 客户 端 或 者 服务 器 程序 的 基本 组 件 ， 无 论 两 者 间 通 信 是 使 用 TCP，UDP 
或 者 Unix domain sockets。 在 第 一 章 中 我 们 已 经 使 用 过 的 net/http 包 里 的 方法 ， 也 算是 net 包 


的 一 部 分 。 
我 们 的 第 一 个 例子 是 一 个 顺序 执行 的 时 钟 服务 器 ， 它 会 每 隔 一 秒 钟 将 当前 时 间 写 到 客户 端 


gopl.io/ch8/clock1 


// Clocki is a TCP server that periodically writes the time. 


package main 


import ( 
Nao" 
"log" 
"net" 
"time" 


func main() { 
listener, err := net.Listen("tcp", "localhost:8000") 
if err != nil { 
log.Fatal(err) 


} 
for { 
conn, err := listener.Accept() 
if err != nil { 
log.Print(err) // e.g., connection aborted 
continue 
} 
handleConn(conn) // handle one connection at a time 
} 


func handleConn(c net.Conn) { 
defer c.Close() 


for { 
_, err := i0.WriteString(c, time.Now().Format("15:04:05\n")) 
if err != nil { 
return // e.g., Client disconnected 
} 


time.Sleep(1 * time.Second) 


Listen 元 数 创建 了 一 个 net.Listener 的 对 象 ， 这 个 对 象 会 监听 一 个 网 络 端口 上 到 来 的 连接 ， 在 这 
个 例子 里 我 们 用 的 是 TCP 的 localhost:8000 端 口 。listener 对 象 的 Accept 方 法 会 直接 阻塞 ， 直 到 
一 个 新 的 连接 被 创建 ， 然 后 会 返回 一 个 net.Conn 对 象 来 表示 这 个 连接 。 


handleConn 函 数 会 处 理 一 个 完整 的 客户 端 连接 。 在 一 个 for 死 循环 中 ， 将 当前 的 时 候 用 
time.Now() 有 函数 得 到 ， 然 后 写 到 客户 端 。 由 于 net.Conn 实 现 了 io.Writer 接 口 ， 我 们 可 以 直接 向 
其 写 入 内 容 。 这 个 死 循 环 会 一 直 执 行 ， 直 到 写 入 失败 。 最 可 能 的 原因 是 客户 端 主动 断 开 连 

接 。 这 种 情况 下 handleConn 函 数 会 用 defer 调 用 关闭 服务 器 侧 的 连接 ， 然 后 返回 到 主 函 数 ， 继 
续 等 待 下 一 个 连接 请 求 。 


time.Time.Format 方 法 提供 了 一 种 格式 化 日 期 和 时 间 信 息 的 方式 。 它 的 参数 是 一 个 格式 化 模板 
标识 如 何 来 格式 化 时 间 ， 而 这 个 格式 化 模板 限定 为 Mon Jan 2 03:04:05PM 2006 UTC-0700 。 
有 8 个 部 分 ( 周 几 ， 月 份 ， 一 个 月 的 第 几 天 ， 等 等 )。 可 以 以 任意 的 形式 来 组 合 前 面 这 个 模板 ; 
出 现在 模板 中 的 部 分 会 作为 参考 来 对 时 间 格 式 进行 输出 。 在 上 面 的 例子 中 我 们 只 用 到 了 人 小 

时 、 分 钟 和 秒 。time 包 里 定义 了 很 多 标准 时 间 格 式 ， 比 如 time.RFC1123。 在 进行 格式 化 的 逆 
向 操作 time.Parse 时 ， 也 会 用 到 同样 的 策略 。( 译 注 : 这 是 go 语言 和 其 它 语言 相 比 比较 奇 苑 的 
一 个 地 方 。。 你 需要 记 住 格式 化 字符 串 是 1 月 2 日 下 午 3 点 4 分 5 秒 零 六 年 UTC-0700， 而 不 像 其 
它 语言 那样 Y-m-d H:i:s 一 样 ， 当 然 了 这 里 可 以 用 1234567 的 方式 来 记忆 ， 倒 是 也 不 麻烦 ) 


为 了 连接 例子 里 的 服务 器 ， 我 们 需要 一 个 客户 端 程序 ， 比 如 netcat 这 个 工具 (nc 命令 )， 这 个 工 
具 可 以 用 来 执行 网 络 连接 操作 。 


$ go build gopl.io/ch8/clock1i 
$ ./clocki & 

$ nc localhost 8000 

13:58:54 

13:58:55 

13:58:56 

13:58:57 

AC 


客户 端 将 服务 器 发 来 的 时 间 显 示 了 出 来 ， 我 们 用 Control+C 来 中 断 客户 端的 执行 ， 在 Unix 系 统 
上 ， 你 会 看 到 AC 这 样 的 响应 。 如 果 你 的 系统 没有 装 nc 这 个 工具 ， 你 可 以 用 telnet 来 实现 同样 的 
效果 ， 或 者 也 可 以 用 我 们 下 面 的 这 个 用 go 写 的 简单 的 telnet 程 序 ， 用 net.Dial 就 可 以 简单 地 创 
建 一 个 TCP 连 接 : 


gopl.io/ch8/netcat1 


// Netcat1 is a read-only TCP client. 
package main 


import ( 
Nao" 
"log" 
Bnet 


"os" 


) 


func main() { 
conn, err := net.Dial("tcp", "localhost:8000") 
if err != nil { 
log.Fatal(err) 
} 


defer conn.Close() 


mustCopy(os.Stdout, conn) 
} 


func mustCopy(dst io.Writer, src io.Reader) { 
if _, err := 10.Copy(dst, src); err != nil { 
log.Fatal(err) 


这 个 程序 会 从 连接 中 读 取 数据 ， 并 将 读 到 的 内 容 写 到 标准 输出 中 ， 直 到 遇 到 end of file 的 条 件 
或 者 发 生 错 误 。 mustCopy ai 外 防 数 我 们 在 本 节 的 几 个 例子 中 都 会 用 到 。 让 我 们 同时 运行 两 个 
客户 端 来 进行 一 个 测试 ， 这 里 可 以 开 两 个 终端 窗口 ， 下 面 左 边 的 是 其 中 的 一 个 的 输出 ， 右 边 
的 是 另 一 个 的 输出 : 


$ go build gopl.io/ch8/netcat1i 


$ ./netcati 

13:58:54 $ ./netcat1i 

13:58:55 

13:58:56 

AC 
13:58:57 
13:58:58 
13:58:59 
AC 

$ killall clock1i 

killall 命 令 是 一 个 Unix 命 令 行 工具 ， 可 以 用 给 定 的 进程 名 来 杀 掉 所 有 名 字 匹 配 的 进程 。 


第 二 个 客户 端 必 须 等 待 第 一 个 客户 端 完成 工作 ， 这 样 服务 端 才能 继续 向 后 执行 ; 因为 我 们 这 
里 的 服务 器 程序 同一 时 间 只 能 处 理 一 个 客户 端 连接 。 我 们 这 里 对 服务 端 程序 做 一 点 小 改动 ， 
殉 其 支持 并 发 : 在 handleConn 函 数 调 用 的 地 方 增加 go 关键 字 ， 让 每 一 次 handleConn 的 调用 都 
进入 一 个 独立 的 goroutine ° 


gopl.io/ch8/clock2 


for { 
conn, err := listener.Accept() 
if err != nil { 
log.Print(err) // e.g., connection aborted 
continue 
} 
go handleConn(conn) // handle connections concurrently 
} 


现在 多 个 客户 端 可 以 同时 接收 到 时 间 了 : 


$ go build gopl.io/ch8/clock2 
$ ./clock2 & 
$ go build gopl.io/ch8/netcati 


$ ./netcati 

14:02:54 $ ./netcat1i 
14:02:55 14:02:55 
14:02:56 14:02:56 
14:02:57 AC 

14:02:58 

14:02:59 $ ./netcat1i 
14:03:00 14:03:00 
14:03:01 14:03:01 

AC 14:03:02 


$ killall clock2 


练习 8.1: 修改 clock2 来 支持 传 入 参数 作为 端口 号 ， 然 后 写 一 个 clockwall 的 程序 ， 这 个 程序 可 
以 同时 与 多 个 clock 服 务 器 通信 ， 从 多 服务 器 中 读 取 时 间 ， 并 且 在 一 个 表格 中 一 次 显示 所 有 服 
务 传 回 的 结果 ， 类 似 于 你 在 某 些 办 公 室 里 看 到 的 时 钟 墙 。 如果 你 有 地 理学 上 分 布 式 的 服务 器 
可 以 用 的 话 ， 让 这 些 服务 器 跑 在 不 同 的 机 器 上 面 ; 或 者 在 同一 台 机 器 上 跑 多 个 不 同 的 实例 ， 
这 些 实例 监听 不 同 的 端口 ， 假 装 自己 在 不 同 的 时 区 。 像 下 面 这 样 : 


$ TZ=US/Eastern ./clock2 -port 8010 & 
$ TZ=Asia/Tokyo ./Clock2 -port 8020 & 
$ TZ=Europe/London ./clock2 -port 8030 & 
$ clockwall NewYork=localhost:8010 Tokyo=localhost:8020 London=localhost : 8030 


练习 8.2: 实现 一 个 并 发 FTP 服 务 器 。 服 务 器 应 该 解析 客户 端 来 的 一 些 命令 ， 比 如 cd 命令 来 切 
换 目 录 ，|s 来 列 出 目录 内 文件 ，get 和 send 来 传输 文件 ，close 来 关闭 连接 。 你 可 以 用 标准 的 ftp 
命令 来 作为 客户 端 ， 或 者 也 可 以 自己 实现 一 个 。 


示例 : 并 发 的 Clock 服 务 
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8.3. 示例 : 并 发 的 Echo 服务 


clock 服 务 器 每 一 个 连接 都 会 起 一 个 goroutine。 在 本 节 中 我 们 会 创建 一 个 echo 服 务 器 ， 这 个 服 
务 在 每 个 连接 中 会 有 多 个 goroutine。 大 多 数 echo 服 务 仅 仅 会 返回 他 们 读 取 到 的 内 容 ， 就 像 下 
i 2k 4 fa} 4 49 handleConn & 4 PF BK A — AE : 


func handleConn(c net.Conn) { 
io.Copy(c, c) // NOTE: ignoring errors 
c.Close() 


一 个 更 有 意思 的 echo 服 务 应 该 模拟 一 个 实际 的 echo 的 “回响 ”， 并 且 一 开始 要 用 大 写 HELLO 来 
表示 "声音 很 大 ， 之 后 经 过 一 小 段 延 迟 返回 一 个 有 所 缓和 的 Hello， 然 后 一 个 全 小 写字 母 的 
hello 表 示 声 音 渐渐 变 小 直至 消失 ， 像 下 面 这 个 版 本 的 handleConn( 译 注 : 笑 看 作者 脑 洞 大 
开 ) : 


gopl.io/ch8/reverb1 


func echo(c net.Conn, shout string, delay time.Duration) { 
fmt.Fprintln(c, "\t", strings.ToUpper (shout ) ) 
time.Sleep(delay) 
fmt.Fprintln(c, "\t", shout) 
time.Sleep(delay) 
fmt.Fprintln(c, "\t", strings.ToLower (shout ) ) 


} 


func handleConn(c net.Conn) { 
input := bufio.NewScanner(c) 
for input.Scan() { 
echo(c, input.Text(), i*time.Second) 


// NOTE: ignoring potential errors from input.Err() 


c.Close() 


我 们 需要 升级 我 们 的 客户 端 程序 ， 这 样 它 就 可 以 发 送 终端 的 输入 到 服务 器 ， 并 把 服务 端的 返 
回 输出 到 终端 上 ， 这 使 我 们 有 了 使 用 并 发 的 另 一 个 好 机 会 : 


gopl.io/ch8/netcat2 


func main() { 
conn, err := net.Dial("tcp", "localhost:8000") 
if err != nil { 
log.Fatal(err) 
} 
defer conn.Close() 
go mustCopy(os.Stdout, conn) 
mustCopy(conn, os.Stdin) 


4 main goroutine 从 标准 输入 流 中 读 取 内 容 并 将 其 发 送 给 服务 器 时 ， 另 一 个 goroutine 会 读 取 并 


务 器 时 
打印 服务 端的 响应 。 当 main goroutine 碰 到 输入 终止 时 ， 例 如 ， 用 户 在 终端 中 按 了 Control- 
D(AD)， 在 windows 上 是 Control-Z， 这 时 程序 就 会 被 终止 ， 尽 管 其 它 goroutine 中 还 有 进行 中 的 
务 。( 在 8.4.1 中 引入 了 channels 后 我 们 会 明白 如 何 让 程序 等 待 两 边 都 结束 )。 


下 面 这 个 会 话 中 ， 客 户 端的 输入 是 左 对 齐 的 ， 服 务 端的 响应 会 用 缩 进来 区 别 显 示 。 客户 端 会 
向 服务 器 " 喊 三 次 话 ” : 


$ go build gopl.io/ch8/reverb1i 
$ ./reverb1i & 
$ go build gopl.io/ch8/netcat2 
$ ./netcat2 
Hello? 
HELLO? 
Hello? 
hello? 
Is there anybody there? 
IS THERE ANYBODY THERE? 
Yooo-hooo! 
Is there anybody there? 
is there anybody there? 
YOOO-HOOO! 
Yooo-hooo! 
yooo-hooo! 
AD 
$ killall reverb1 


注意 客户 端的 第 三 次 shout 在 前 一 个 shout 处 理 完 成 之 前 一 直 没 有 被 处 理 ， 这 貌似 看 起 来 不 是 特 
别 “ 现 实 *。 真 实 世 界 里 的 回响 应 该 是 会 由 三 次 shout 的 回声 组 合 而 成 的 。 为 了 模拟 实 世界 的 
回响 ， 我 们 需要 更 多 的 goroutine 来 做 这 件 事情 。 这 样 我 们 就 再 一 次 地 需要 go 这 个 关键 词 了 ， 
这 次 我 们 用 它 来 调用 echo : 


gopl.io/ch8/reverb2 


func handleConn(c net.Conn) { 
input := bufio.NewScanner(c) 
for input.Scan() { 
go echo(c, input.Text(), i*time.Second) 
} 
// NOTE: ignoring potential errors from input.Err() 


c.Close() 


go 后 跟 的 函数 的 参数 会 在 go 语句 自身 执行 时 被 求 值 ; 因此 input.Text() 会 在 main goroutine 中 被 
求 值 。 现 在 回响 是 并 发 并 且 会 按时 间 来 覆盖 掉 其 它 响 应 了 : 


$ go build gopl.io/ch8/reverb2 
$ ./reverb2 & 
$ ./netcat2 
Is there anybody there? 
IS THERE ANYBODY THERE? 
Yooo-hooo! 
Is there anybody there? 
YOOO-HOOO! 
is there anybody there? 
Yooo-hooo! 
yooo-hooo! 
AD 
$ killall reverb2 


让 服务 使 用 并 发 不 只 是 处 理 多 个 客户 端的 请 求 ， 甚 至 在 处 理 单个 连接 时 也 可 能 会 用 到 ， 就 像 
我 们 上 面 的 两 个 go 关键 词 的 用 法 。 然 而 在 我 们 使 用 go 关键 词 的 同时 ， 需 要 惯 重 地 考虑 
net.Conn 中 的 方法 在 并 发 地 调用 时 是 否 安全 ， 事 实 上 对 于 大 多 数 类 型 来 说 也 确实 不 安全 。 我 
们 会 在 下 一 章 中 详细 地 探讨 并 发 安全 性 。 


8.4. Channels 


如 果 说 goroutine 是 Go 语音 程序 的 并 发 体 的 话 ， 那 么 channels 它 们 之 间 的 通信 机 制 。 一 个 
channels 是 一 个 通信 机 制 ， 它 可 以 让 一 个 goroutine 通 过 它 给 另 一 个 goroutine 发 送 值 信息 。 每 
个 channel 都 有 一 个 特殊 的 类 型 ， 也 就 是 channels 可 发 送 数 据 的 类 型 。 一 个 可 以 发 送 int 类 型 数 
据 的 channel 一 般 写 为 chan int ° 


使 用 内 置 的 make 函 数 ， 我 们 可 以 创建 一 个 channel : 


ch := make(chan int) // ch has type "chan int' 


和 map 类 似 ，channel 也 一 个 对 应 make 创 建 的 底层 数据 结构 的 引用 。 当 我 们 复制 一 个 channel 
或 用 于 函数 参数 传递 时 ， 我 们 只 是 拷贝 了 一 个 channel 引 用 ， 因 此 调用 者 何 被 调用 者 将 引用 同 
一 个 channel 对 象 。 和 其 它 的 引用 类 型 一 样 ，channel 的 零 值 也 是 nil 。 


两 个 相同 类 型 的 channel 可 以 使 用 == 运 算 符 比 较 。 如 果 两 个 channel 引 用 的 是 相通 的 对 象 ， 那 
么 比较 的 结果 为 真 。 一 个 channel 也 可 以 和 nil 进 行 比较 。 


一 个 channel 有 发 送 和 接受 两 个 主要 操作 ， 都 是 通信 行为 。 一 个 发 送 语句 将 一 个 值 从 一 个 
goroutine 通 过 channel 发 送 到 另 一 个 执行 接收 操作 的 goroutine。 发 送 和 接收 两 个 操作 都 是 
用 <- 运算 符 。 在 发 送 语句 中 ， < 运算 符 分 割 channel 和 要 发 送 的 值 。 在 接收 语句 中 ， <- 运 
算 符 写 在 channel 对 象 之 前 。 一 个 不 使 用 接收 结果 的 接收 操作 也 是 合法 的 。 





ive statement; result is discarded 





Channel 还 支持 close 操 作 ， 用 于 关闭 channel， 随 后 对 基于 该 channel 的 任何 发 送 操作 都 将 导 
致 panic 异 常 。 对 一 个 已 经 被 close 过 的 channel 之 行 接收 操作 依然 可 以 接受 到 之 前 已 经 成 功 发 
送 的 数据 ; 如 果 channel 中 已 经 没有 数据 的 话 讲 产生 一 个 零 值 的 数据 。 


使 用 内 置 的 close 函 数 就 可 以 关闭 一 个 channel : 


close(ch) 


VA ae fa] 2 HF ATA A make & ža E hgt — 7 AP channel > ÆRA T VAG HAHN 
形 参 数 ， 对 应 channel 的 容量 。 如 果 channe| 的 容量 大 于 堆 ， 那 么 该 channel 就 是 带 缓 冲 的 
channel。 


ch = make(chan int) // unbuffered channel 
ch = make(chan int, 0) // unbuffered channel 
ch = make(chan int, 3) // buffered channel with capacity 3 


我 们 将 先 讨论 无 缓冲 的 channel， 然 后 在 8.4.4 节 讨论 带 缓冲 的 channel ° 


8.4.1. 不 带 缓 存 的 Channels 


一 个 基于 无 缓存 Channels 的 发 送 操作 将 导致 发 送 者 goroutine 阻 塞 ， 直 到 另 一 个 goroutine 在 相 
ea 当 发 送 的 值 通过 Channels 成 功 传输 之 后 ， 两 个 goroutine 可 以 

续 执 行 后 面 的 语 多。 反之， 如 果 接 收 操作 先 发 生 ， 那 么 接收 者 goroutine 也 将 阻塞 ， 直 到 有 
一 个 goroutine 在 相同 的 Channels 上 执行 发 送 操作 。 


基于 无 缓存 Channels 的 发 送 和 接收 操作 将 导致 两 个 goroutine 做 一 次 同步 操作 。 因 为 这 个 原 
因 ， 无 缓存 Channels 有 时 候 也 被 称 为 同步 Channels。 当 通过 一 个 无 缓存 Channels 发 送 数据 
时 ， 接 收 者 收 到 数据 发 生 在 唤醒 发 送 者 goroutine 之 前 (译注 : happens before， 这 是 Go 语言 
并 发 内 存 模型 的 一 个 关键 术语 ! ) o 


在 讨论 并 发 编程 时 ， 当 我 们 说 x 事件 在 y 事 件 之 前 发 生 (happens before) ， 我 们 并 不 是 说 x 事 
件 在 时 间 上 比 y 时 间 更 早 ; 我 们 要 表达 的 意思 是 要 保证 在 此 之 前 的 事件 都 已 经 完成 了 ， 例 如 在 
此 之 前 的 更 新 某 些 变量 的 操作 已 经 完成 ， 你 可 以 放心 依赖 这 些 已 完成 的 事件 了 。 


当 我 们 说 x 事件 既 不 是 在 y 事 件 之 前 发 生 也 不 是 在 y 事 件 之 后 发 生 ， 我 们 就 说 x 事件 和 y 事 件 是 并 
发 的 。 这 并 不 是 意味 着 x 事件 和 y 事 件 就 一 定 是 同时 发 生 的 ， 我 们 只 是 不 能 确定 这 两 个 事件 发 
生 的 先后 顺序 。 在 下 一 章 中 我 们 将 看 到 ， 当 两 个 goroutine 并 发 访问 了 相同 的 变量 时 ， 我 们 有 
必要 保证 某 些 事件 的 执行 顺序 ， 以 避免 出 现 某 些 并 发 问题 。 


在 8.3 节 的 客户 端 程序 ， 它 在 主 goroutine 中 (译注 : 就 是 执行 main 元 数 的 goroutine) 将 标准 输 
入 复制 到 server， 因 此 当 客 户 端 程序 关闭 标准 输入 时 ， 后 台 goroutine 可 能 依然 在 工作 。 我 们 
需要 让 主 goroutine 等 待 后 台 goroutine 完 成 工作 后 再 退出 ， 我 们 使 用 了 一 个 channel 来 同步 两 个 
goroutine : 


gopl.io/ch8/netcat3 


func main() { 
conn, err := net.Dial("tcp", "localhost:8000") 
if err != nil { 
log.Fatal(err) 


} 
done := make(chan struct{}) 
go func() { 
io.Copy(os.Stdout, conn) // NOTE: ignoring errors 
log.Println("done") 
done <- struct{}{} // signal the main goroutine 
}() 


mustCopy(conn, os.Stdin) 
conn.Close() 
<-done // wait for background goroutine to finish 


当 用 户 关 闭 了 标准 输入 ， 主 goroutine 中 的 mustCopy 有 函数 调用 将 返回 ， 然 后 调用 conn.Close() 
关闭 读 和 写 方向 的 网 络 连 接 。 关 闭 网 络 链接 中 的 写 方向 的 链接 将 导致 server 程 序 收 到 一 个 文件 
(end-of-file) 结束 的 信号 。 关 闭 网 络 链接 中 读 方 向 的 链接 将 导致 后 台 goroutine 的 io.Copy 函 
数 调用 返回 一 个 "read from closed connection”(“ 从 关闭 的 链接 读 ”) 类 似 的 错误 ， 因 此 我 们 临 
时 移 除 了 错误 日 志 语 句 ; 在 练习 8.3 将 会 提供 一 个 更 好 的 解决 方案 。 (需要 注意 的 是 go 语句 调 

用 了 一 个 函数 字面 量 ， 这 Go 语言 中 启动 goroutine 常 用 的 形式 。) 


在 后 侣 goroutine 返 回 之 前 ， 它 先 打 印 一 个 日 志 信 息 ， 然 后 向 done 对 应 的 channel 发 送 一 个 值 。 
主 goroutine 在 退出 前 先 等 待 从 done 对 应 的 channel 接 收 一 个 值 。 因 此 ， 总 是 可 以 在 程序 退出 前 
正确 输出 "done” 消 息 。 


基于 channels 发 送 消 息 有 两 个 重要 方面 。 首 先 每 个 消息 都 有 一 个 值 ， 但 是 有 时 候 通讯 的 事实 
和 发 生 的 时 刻 也 同样 重要 。 当 我 们 更 希望 强调 通讯 发 生 的 时 刻 时 ， 我 们 将 它 称 为 消息 事件 。 
有 些 消息 事件 并 不 携带 额外 的 信息 ， 它 仅仅 是 用 作 两 个 goroutine 之 间 的 同步 ， 这 时 候 我 们 可 
以 用 struct{} 空 结构 体 作为 channels 元 素 的 类 型 ， 虽 然 也 可 以 使 用 bool 或 int 类 型 实现 同样 的 
功能 ，done <- 1 语句 也 比 done <- struct{}{} 更 短 。 


练习 8.3 : 在 netcat3 例 子 中 ，conn 虽 然 是 一 个 interface 类 型 的 值 ， 但 是 其 底层 丨 实 类 型 
是 *net.TCPConn ， 代 表 一 个 TCP 链 接 。 一 个 TCP 链 接 有 读 和 写 两 个 部 分 ee 
CloseRead 和 CloseWrite 方 法 分 别 关 闭 它 们 。 修 改 netcat3 的 主 goroutine 代 码 ， 只 关闭 网 络 链 
接 中 写 的 部 分 ， 这 样 的 话 后 台 goroutine 可 以 在 标准 输入 被 关闭 后 继续 打印 从 reverb1 服 务 器 传 
回 的 数据 。 (要 在 reverb2 服 务 器 也 完成 同样 的 功能 是 比较 困难 的 ; 参考 练习 8.4。) 


8.4.2. 串联 的 Channels (Pipeline ) 


Channels 也 可 以 用 于 将 多 人 Toylne a= 起 ， 一 个 Channels 的 输出 作为 下 一 个 Channels 
的 输入 。 这 种 串联 的 Channels 就 是 所 谓 的 管道 (pipeline) 。 下 面 的 程序 用 两 个 channels 将 三 
个 goroutine 串联 起 来 ， 如 图 8.1 所 示 。 


Counter Squarer Printer 
naturals squares 





Figure 8.1. A three-stage pipeline. 


第 一 个 goroutine 是 一 个 计数 器 ， 用 于 生成 0、1、2、...... 形式 的 整数 序列 ， 然 后 通过 channel 
将 该 整数 序列 发 送 给 第 二 个 goroutine ; 第 二 个 goroutine 是 一 个 求 平方 的 程序 ， 对 收 到 的 每 个 
整数 求 平方 ， 然 后 将 平方 后 的 结果 通过 第 二 个 channel 发 送 给 第 三 个 goroutine ; 第 三 个 
goroutine 是 一 个 打印 程序 ， 打 印 收 到 的 每 个 整数 。 为 了 保持 例子 清晰 ， 我 们 有 意 选 择 了 非常 
简单 的 函数 ， 当 然 三 个 goroutine 的 计算 很 简单 ， 在 现实 中 确实 没有 必要 为 如 此 简单 的 运算 构 
建 三 个 goroutine ° 


gopl.io/ch8/pipeline1 


func main() { 


naturals := make(chan int) 
squares := make(chan int) 
// Counter 
go func() { 

ile Se get (OR A a 


naturals <- x 
} 
#0) 


// Squarer 
go func() { 
for { 
x := <-naturals 
squares <- x * x 
} 
}() 


// Printer (in main goroutine) 
for { 
fmt .Println(<-squares) 


} 


如 您 所 料 ， 上 面 的 程序 将 生成 0、1、4、9、...... 形式 的 无 穷 数 列 。 像 这 样 的 串联 Channels 的 
管道 (Pipelines) 可 以 用 在 需要 长 时 间 运 行 的 服务 中 ， 每 个 长 时 间 运 行 的 goroutine 可 能 会 包 
含 一 个 死 循 环 ， 在 不 同 goroutine 的 死 循 环 内 部 使 用 串联 的 Channels 来 通信 。 但 是 ， 如 果 我 们 
项 


望 通过 Channels 只 发 送 有 限 的 数列 该 如 何 处 理 呢 ? 


如 果 发 送 者 知道 ， 没 有 更 多 的 值 需要 发 送 到 channel 的 话 ， 那 么 让 接收 者 也 能 及 时 知道 没有 多 
余 的 值 可 接收 将 是 有 用 的 ， 因 为 接收 者 可 以 停止 不 必要 的 接收 等 待 。 这 可 以 通过 内 置 的 close 
函数 来 关闭 channel 实 现 : 


close(naturals) 


当 一 个 channel 被 关闭 后 ， 再 向 该 channel 发 送 数据 将 导致 panic 措 常 。 当 一 个 被 关闭 的 channel 
中 已 经 发 送 的 数据 都 被 成 功 接收 后 ， 后 续 的 接收 操作 将 不 再 阻塞 ， 它 们 会 立即 返回 一 个 零 
值 。 关 闭 上 面 例子 中 的 naturals 变 量 对 应 的 channel 并 不 能 终止 循环 ， 它 依然 会 收 到 一 个 永 无 
休止 的 零 值 序列 ， 然 后 将 它们 发 送 给 打印 者 goroutine 。 


没有 办 法 直接 测试 一 个 channel 是 否 被 关闭 ， 但 是 接收 操作 有 一 个 变 体形 式 : 它 多 接收 一 个 结 
果 ， 多 接收 的 第 二 个 结果 是 一 个 布尔 值 ok，ture 表 示 成 功 从 channels 接 收 到 值 ，false 表 示 
channels 已 经 被 关闭 并 且 里 面 没有 值 可 接收 。 使 用 这 个 特性 ， 我 们 可 以 修改 squarer 函 数 中 的 
循环 代码 ， 当 naturals 对 应 的 channel 被 关闭 并 没有 值 可 接收 时 跳出 循环 ， 并 且 也 关闭 squares 
对 应 的 channel. 


// Squarer 
go func() { 
for { 
x, ok := <-naturals 
if tok { 
break // channel was closed and drained 
} 


squares <- x * x 


} 


close(squares) 


}() 


因为 上 面 的 语法 是 策 抽 的， 而 且 这 种 处 理 模式 很 场景 ， 因 此 Go 语言 的 range 循 环 可 直接 在 
channels 上 面 迭代 。 使 用 range 循 环 是 上 面 处 理 模 式 的 简洁 语法 ， 它 依次 从 channel 接 收 数 
据 ， 当 channel 被 关闭 并 且 没 有 值 可 接收 时 跳出 循环 。 


在 下 面 的 改进 中 ， 我 们 的 计数 器 goroutine 只 生成 100 个 含 数字 的 序列 ， 然 后 关闭 naturals 对 应 
的 channel， 这 将 导致 计算 平方 数 的 Squarer 对 应 的 goroutine 可 以 正常 终止 循环 并 关闭 squares 
对 应 的 channel。 (在 一 个 更 复杂 的 程序 中 ， 可 以 通过 defer 语 名 关闭 对 应 的 channel。) 最 

后 ， 主 goroutine 也 可 以 正常 终止 循环 并 退出 程序 。 


gopl.io/ch8/pipeline2 


func main() { 


naturals := make(chan int) 
squares := make(chan int) 
// Counter 
go func() { 
for x -= Oi x O00 Xb 


naturals <- x 


} 
close(naturals) 
}() 
// Squarer 
go func() { 
for x := range naturals { 
squares <- x * x 
} 
close(squares) 
}() 
// Printer (in main goroutine) 
for x := range squares { 


fmt.Println(x) 


其 实 你 并 不 需要 关闭 每 一 个 channel。 只 要 当 需 要 告诉 接收 者 goroutine， 所 有 的 数据 已 经 全 部 
发 送 时 才 需 要 关闭 channel。 不 管 一 个 channel 是 否 被 关闭 ， 当 它 没有 被 引用 时 将 会 被 Go 语言 
的 垃圾 自动 回收 器 回收 。 (不 要 将 关闭 一 个 打开 文件 的 操作 和 关闭 一 个 channel 操 作 混淆 。 对 
于 每 个 打开 的 文件 ， 都 需要 在 不 使 用 的 使 用 调用 对 应 的 Close 方 法 来 关闭 文件 。) 


视图 重复 关闭 一 个 channel 将 导致 panic 异 常 ， 视 图 关闭 一 个 nil 值 的 channel 也 将 导致 panic 弄 
常 。 关 闭 一 个 channels 还 会 触发 一 个 广播 机 制 ， 我 们 将 在 8.9 节 讨论 。 


8.4.3. 单方 向 的 Channel 


随 着 程序 的 增长 ， 人 们 习惯 于 将 大 的 函数 拆 分 为 小 的 函数 。 我 们 前 面 的 例子 中 使 用 了 三 个 
goroutine， 然 后 用 两 个 channels 连 链接 它们 ， 它 们 都 是 main 函 数 的 局 部 变量 。 将 三 个 
goroutine 拆 分 为 以 下 三 个 函数 是 自然 的 想法 : 


func counter(out chan int) 
func squarer(out, in chan int) 
func printer(in chan int) 


其 中 squarer 计 算 平 方 的 函数 在 两 个 串联 Channels 的 中 间 ， 因 此 拥有 两 个 channels 类 型 的 参 
数 ， 一 个 用 于 输入 一 个 用 于 输出 。 每 个 channels 都 用 有 相同 的 类 型 ， 但 是 它们 的 使 用 方式 想 
反 : 一 个 只 用 于 接收 ， 另 一 个 只 用 于 发 送 。 参 数 的 名 字 in 和 out 已 经 明确 表示 了 这 个 意图 ， 但 
是 并 无 法 保证 squarer 有 函数 向 一 个 in 参数 对 应 的 channels 发 送 数据 或 者 从 一 个 out 参 数 对 应 的 
channels 接 收 数据 。 


这 种 场景 是 典型 的 。 当 一 个 channel 作 为 一 个 函数 参数 是 ， 它 一 般 总 是 被 专门 用 于 只 发 送 或 者 
只 接收 。 


为 了 表明 这 种 意图 并 防止 被 滥用 ，Go 语 言 的 类 型 系统 提供 了 单方 向 的 channel 类 型 ， 分 别 用 于 
只 发 送 或 只 接收 的 channel。 类 型 chan<- int 表示 一 个 只 发 送 int 的 channel， 只 能 发 3 
收 。 相 反 ， 类 型 <-chan int 表示 一 个 只 接收 int 的 channel， 只 能 接收 不 能 发 送 。 (箭头 <- 和 
关键 字 chan 的 相对 位 置 表明 了 channel 的 方向 。) 这 种 限制 将 在 编译 期 检测 。 


on 
Rr 
is 
X 
Ge 
HK 


为 关闭 操作 只 用 于 断言 不 再 向 channel 发 送 新 的 数据 ， 所 以 只 有 在 发 送 者 所 在 的 goroutine 才 
会 调用 close 函 数 ， 因 此 对 一 个 只 接收 的 channel 调 用 close 将 是 一 个 编译 错误 。 


这 是 改进 的 版 本 ， 这 一 次 参数 使 用 了 单方 向 channel 类 型 : 
gopl.io/ch8/pipeline3 


func counter(out chan<- int) { 


fon x = 0; x < 100; xt 4 
out <- x 
} 
close(out) 
} 
func squarer(out chan<- int, in <-chan int) { 
for v := range in { 
out <- v* v 
} 
close(out) 
} 
func printer(in <-chan int) { 
for v := range in { 
fmt.Println(v) 
i 
} 
func main() { 
naturals := make(chan int) 
squares := make(chan int) 


go counter(naturals) 
go squarer(squares, naturals) 
printer(squares) 


调用 counter(naturals) 将 导致 将 chan int 类 型 的 naturals 隐 式 地 转换 为 chan<- int 类 型 只 发 
送 型 的 channel。 调 用 printer(squares) 也 会 导致 相似 的 隐 式 转换 ， 这 一 次 是 转换 为 <-chan 
int 类 型 只 接收 型 的 channel。 任 何 双 向 channel 向 单 向 channel 变 量 的 典 值 操作 都 将 导致 该 隐 
式 转换 。 这 里 并 没有 反 向 转换 的 语法 : 也 就 是 不 能 一 个 将 类 似 chan<- int 类 型 的 单 向 型 的 
channel 转 换 为 chan int 类 型 的 双向 型 的 channel。 


8.4.4. #2 4 4 Channels 


带 缓 存 的 Channel 内 部 持 有 一 个 元 素 队 列 。 队 列 的 最 大 容量 是 在 调用 make 函 数 创 建 channel 时 
通过 第 二 个 参数 指定 的 。 下 面 的 语 钨 创建 了 一 个 可 以 持 有 三 个 字符 串 元 素 的 带 缓 存 Channel 。 
图 8.2 是 ch 变量 对 应 的 channel 的 图 形 表 示 形 式 。 


ch = make(chan string, 3) 


Figure 8.2. An empty buffered channel. 


向 缓存 Channel 的 发 送 操作 就 是 向 内 部 缓存 队列 的 尾部 插入 元 素 ， 接 收 操作 则 是 从 队列 的 头 部 
删除 元 素 。 如 果 内 部 缓存 队列 是 满 的 ， 那 么 发 送 操作 将 阻塞 直到 因 另 一 个 goroutine 执 行 接收 
操作 而 释放 了 新 的 队列 空间 。 相 反 ， 如 果 channel 是 空 的 ， 接 收 操作 将 阻塞 直到 有 另 一 个 
goroutine 执 行 发 送 操作 而 向 队列 插入 元 素 。 


我 们 可 以 在 无 阻塞 的 情况 下 连续 向 新 创建 的 channel 发 送 三 个 值 : 


ch Be Wan 
ch cae "B" 
ch ZE ue 


此 刻 ，channel 的 内 部 缓存 队列 将 是 满 的 《图 8.3) ， 如 果 有 第 四 个 发 送 操作 将 发 生 阻塞 。 


Figure 8.3. A full buffered channel. 





如 果 我 们 接收 一 个 值 ， 


fmt.Printin(<-ch) // "A" 


那么 channel 的 缓存 队列 将 不 是 满 的 也 不 是 空 的 (图 8.4) ， 因 此 对 该 channel 执 行 的 发 送 或 接 
收 操作 都 不 会 发 送 阻 塞 。 通 过 这 种 方式 ，channel 的 缓存 队列 解 耦 了 接收 和 发 送 的 goroutine。 


= Z 


Figure 8.4. A partially full buffered channel. 


在 某 些 特殊 情况 下 ， 程 序 可 能 需要 知道 channel 内 部 缓存 的 容量 ， 可 以 用 内 置 的 cap 函 数 获 
取 : 


fmt.Println(cap(ch)) // "3" 


Ree > MTA Elen BA > oR 1% AH channel > Ah A 443% w channel A BAEK PA we 
元 素 的 个 数 。 因 为 在 并 发 程序 中 该 信息 会 随 着 接收 操作 而 失效 ， 但 是 它 对 某 些 故障 诊断 和 性 
能 优化 会 有 帮助 。 


fmt.Println(len(ch)) // "2" 


在 继续 执行 两 次 接收 操作 后 channel 内 部 的 缓存 队列 将 又 成 为 空 的 ， 如 果 有 第 四 个 接收 操作 将 
发 生 阻塞 : 


fmt.Println(<-ch) // "B" 
fmt.Println(<-ch) // "C" 


在 这 个 例子 中 ， 发 送 和 接收 操作 都 发 生 在 同一 个 goroutine 中 ， 但 是 在 丨 是 的 程序 中 它们 一 般 
由 不 同 的 goroutine 执 行 。Go 语 言 新 手 有 时 候 会 将 一 个 带 缓存 的 channel 当 作 同 一 个 goroutine 
中 的 队列 使 用 ， 虽 然 语法 看 似 简单 ， 但 实际 上 这 是 一 个 错误 * Channel 和 goroutine 的 调度 器 机 
制 是 紧密 是 整个 程序 一 一 可 能 会 永远 阻塞。 如 果 你 只 是 需要 
ah ee TTS 





下 面 的 例子 展示 了 一 个 使 用 了 带 缓 存 channel 的 应 用 。 它 并 发 地 向 三 个 镜像 站 点 发 出 请 求 ， 三 
个 镜像 站 点 分 散在 不 同 的 地 理 位 置 。 它 们 分 别 将 收 到 的 响应 发 送 到 带 缓存 channel， 最 后 接收 
者 只 接收 第 一 个 收 到 的 响应 ， 也 就 是 最 快 的 那个 响应 。 因 此 mirroredQuery 函 数 可 能 在 另外 两 
个 响应 慢 的 镜像 站 点 响应 之 前 就 返回 了 结果 。 (顺便 说 一 下 ， 多 个 goroutines 并 发 地 向 同一 个 
channel 发 送 数据 ， 或 从 同一 个 channel 接 收 数 据 都 是 常见 的 用 法 。) 


func mirroredQuery() string { 
responses := make(chan string, 3) 
go func() { responses <- request("asia.gopl.io") }() 
go func() { responses <- request("europe.gopl.io") }() 
go func() { responses <- request("americas.gopl.io") }() 
return <-responses // return the quickest response 


func request(hostname string) (response string) { /* ... */ } 


如 果 我 们 使 用 了 无 缓存 的 channel， 那 么 两 个 慢 的 goroutines 将 会 因为 没有 人 接收 而 被 永远 卡 
住 。 这 种 情况 ， 称 为 goroutines 泄 漏 ， 这 将 是 一 个 BUG。 和 垃圾 变量 不 同 ， 泄 漏 的 goroutines 
并 不 会 被 自动 回收 ， 因 此 确保 每 个 不 再 需要 的 goroutine 能 正常 退出 是 重要 的 。 


关于 无 缓存 或 带 缓存 channels 之 问 的 选择 ， 或 者 是 带 缓存 channels 的 容量 大 小 的 选择 ， 都 可 
能 影响 程序 的 正确 性 。 无 缓存 channel 更 强 地 保证 了 每 个 发 送 操作 与 相应 的 同步 接收 操作 ; 但 
是 对 于 带 缓 存 channel， 这 些 操作 是 解 耦 的 。 同 样 ， 即 使 我 们 知道 将 要 发 送 到 一 个 channe| 的 
信息 的 数量 上 限 ， 创 建 一 个 对 应 容量 大 小 带 缓存 channel 也 是 不 现实 的 ， 因 为 这 要 求 在 执行 任 
何 接收 操作 之 前 缓存 所 有 已 经 发 送 的 值 。 如 果 未 能 分 配 足 够 的 缓冲 将 导致 程序 死 锁 。 


Channel 的 缓存 也 可 能 影响 程序 的 性 能 。 想 象 一 家 蛋糕 店 有 三 个 厨 师 ， 一 个 烘焙 ， 一 个 上 糖 
衣 ， 还 有 一 个 将 每 个 蛋糕 传递 到 它 下 一 个 厨师 在 生产 线 。 在 狭小 的 厨房 空间 环境 ， 每 个 厨师 
在 完成 蛋糕 后 必须 等 待 下 一 个 局 师 已 经 准备 好 接受 它 ; 这 类 似 于 在 一 个 无 缓存 的 channel 上 进 
行 沟通 。 


如 果 在 每 个 厨师 之 间 有 一 个 放置 一 个 蛋糕 的 额外 空间 ， 那 么 每 个 局 师 就 可 以 将 一 个 完成 的 蛋 
糕 临 时 放 在 那里 而 马上 进入 下 一 个 蛋糕 在 制作 中 ; 这 类 似 于 将 channel 的 缓存 队列 的 容量 设置 
为 1。 只 要 每 个 厨师 的 平均 工作 效率 相近 ， 那 么 其 中 大 部 分 的 传输 工作 将 是 迅速 的 ， 个 体 之 间 
细小 的 效率 差异 将 在 交接 过 程 中 弥补 。 如 果 司 师 之 问 有 更 大 的 额外 空间 也 是 就 更 大 容量 
的 缓存 队列 一 将 可 以 在 不 停止 生产 线 的 前 提 下 消除 更 大 的 效率 波动 ， 例 如 一 个 局 师 可 以 短 
暂 地 休息 ， 然 后 在 加 快 赶 上 进度 而 不 影响 其 其 他 人 。 





另 一 方面 ， 如 果 生 产 线 的 前 期 阶段 一 直 快 于 后 续 阶 段 ， 那 么 它们 之 间 的 缓存 在 大 部 分 时 间 都 
将 是 满 的。 相反 ， 如 果 后 续 阶 段 比 前 期 阶段 更 快 ， 那么 它们 之 间 的 缓存 在 大 部 分 时 间 都 将 是 
空 的 。 对 于 这 类 场景 ， 人 额外 的 缓存 并 没有 带 来 任何 好 处 。 


生产 线 的 隐喻 对 于 理解 channels 和 goroutines 的 工作 机 制 是 很 有 帮助 的 。 例 如 ， 如 果 第 二 阶段 
是 需要 精心 制作 的 复杂 操作 ， 一 个 厨师 可 能 无 法 跟 上 第 一 个 局 师 的 进度 ， 或 者 是 无 法 满足 第 
阶段 局 师 的 需求 。 要 解决 这 个 问题 ， 我 们 可 以 雇佣 另 一 个 局 师 来 帮助 完成 第 二 阶段 的 工作 ， 
他 执行 相同 的 任务 但 是 独立 工作 。 这 类 似 于 基于 相同 的 channels 创 建 另 一 个 独立 的 
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我 们 没有 太 多 的 空间 展示 全 部 细节 ， 但 是 gopl.io/ch8/cake 包 模拟 了 这 个 蛋糕 店 ， 可 以 通过 不 
同 的 参数 调整 。 它 还 对 上 面 提 到 的 几 种 场景 提供 对 应 的 基准 测试 (811.4) © 
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8.5. 并 发 的 循环 


本 节 中 ， 我 们 会 探索 一 些 用 来 在 并 行 时 循环 迭代 的 常见 并 发 模型 。 我 们 会 探究 从 全 尺寸 图 片 
生成 一 些 缩 略 图 的 问题 。gopl,io/ch8/thumbnail 包 提供 了 ImageFile 函 数 来 帮 有 我 们 拉 伸 图 片 。 我 
们 不 会 说 明 这 个 函数 的 实现 ， 只 需要 从 gopl.io 下 载 它 。 


gopl.io/ch8/thumbnail 


package thumbnail 


// ImageFile reads an image from infile and writes 

// a thumbnail-size version of it in the same directory. 

// tt returns the generated fille name, e.g., “fioo. thumb. jpg". 
func ImageFile(infile string) (string, error) 


下 面 的 程序 会 循环 迭代 一 些 图 片 文件 名 ， 并 为 每 一 张 图 片 生成 一 个 缩 略图 : 
gopl.io/ch8/thumbnail 


// makeThumbnails makes thumbnails of the specified files. 
func makeThumbnails(filenames []string) { 
for _, f := range filenames { 
if _, err := thumbnail.ImageFile(f); err != nil { 
log.Printin(err) 
} 


显然 我 们 处 理 文件 的 顺序 无 关 紧 要 ， 因 为 每 一 个 图 片 的 拉 伸 操作 和 其 它 图 片 的 处 理 操 作 都 是 
彼此 独立 的 。 像 这 种 子 问 题 都 是 完全 彼此 独立 的 问题 被 叫做 多 并 行 问 题 (译注 : 
embarrassingly parallel， 直 译 的 话 更 像 是 旭 座 并 行 )。 易 并 行 问题 是 最 容易 被 实现 成 并 行 的 一 
类 问题 ( 度 话 ) ， 并 且 是 最 能 够 享受 并 发 带 来 的 好 处 ， 能 够 随 着 并 行 的 规模 线性 地 扩展 。 


下 面 让 我 们 并 行 地 执行 这 些 操作 ， 从 而 将 文件 IO 的 延迟 隐藏 掉 ， 并 用 上 多 核 cpu 的 计算 能 力 来 
拉 伸 图 像 。 我 们 的 第 一 个 并 发 程序 只 是 使 用 了 一 个 go 关键 字 。 这 里 我 们 先 忽略 掉 错 误 ， 之 后 
再 进行 处 理 。 


// NOTE: incorrect! 
func makeThumbnails2(filenames []string) { 
for _, f := range filenames { 
go thumbnail.ImageFile(f) // NOTE: ignoring errors 


} 


这 个 版 本 运行 的 实在 有 点 太 快 ， 实 际 上 ， 由 于 它 比 最 早 的 版 本 使 用 的 时 间 要 短 得 多 ， 即 使 当 
文件 名 的 slice 中 只 包含 有 一 个 元 素 。 这 就 有 点 奇怪 了 ， 如 果 程 序 没 有 并 发 执行 的 话 ， 那 为 什 
一 个 并 发 的 版 本 还 是 要 快 呢 ? 答案 其 实 是 makeThumbnails 在 它 还 没有 完成 工作 之 前 就 已 经 
回 了 。 它 启动 了 所 有 的 goroutine， 没 一 个 文件 名 对 应 一 个 ， 但 没有 等 待 它们 一 直到 执行 完 
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没有 什么 直接 的 办 法 能 够 等 待 goroutine 完 成 ， 但 是 我 们 可 以 改变 goroutine 里 的 代码 让 其 能 够 

将 完成 情况 报告 给 外 部 的 goroutine 知 晓 ， 使 用 的 方式 是 向 一 个 共享 的 channel 中 发 送 事件 。 因 

为 我 们 已 经 知道 内 部 的 goroutine 只 有 len(filenames)， 所 以 外 部 的 goroutine 只 需要 在 返回 之 前 
对 这 些 事件 计数 。 


// makeThumbnails3 makes thumbnails of the specified files in parallel. 
func makeThumbnails3(filenames []string) { 
ch := make(chan struct{}) 
for _, f := range filenames { 
go func(f string) { 
thumbnail.ImageFile(f) // NOTE: ignoring errors 
ch <- struct{}{} 
}(f) 
} 
// Wait for goroutines to complete. 
for range filenames { 
<-ch 


} 


注意 我 们 将 { 的 值 作为 一 个 显 式 的 变量 传 给 了 函数 ， 而 不 是 在 循环 的 闭 包 中 声明 : 


for _, f := range filenames { 
go func() { 
thumbnail.ImageFile(f) // NOTE: incorrect! 
LY exe 
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的 匿名 元 数值 所 共享 ， 且 会 被 连续 的 循环 迭代 所 更 新 的 。 当 新 的 goroutine 开 始 执行 字面 函数 
时 ，for 循 环 可 能 已 经 更 新 了 f 并 且 开始 了 另 一 轮 的 迭代 或 者 (更 有 可 能 的 ) 已 经 结束 了 整个 特 
环 ， 所 以 当 这 些 goroutine 开 始 读 取 { 的 值 时 ， 它 们 所 看 到 的 值 已 经 是 slice 的 最 后 一 个 元 素 了 。 
显 式 地 添加 这 个 参数 ， 我 们 能 够 确保 使 用 的 f 是 当 go 语 名 执行 时 的 “当前 "那个 f。 


如 果 我 们 想 要 从 每 一 个 worker goroutine 往 主 goroutine 中 返回 值 时 该 怎么 办 呢 ? 当 我 们 调用 
thumbnail. mo a 时 候 ， 它 会 返回 一 个 错误 。 下 一 个 版 本 的 
makeThumbnails 会 返回 其 在 做 拉 伸 操作 时 接收 到 的 第 一 个 错误 : 


// makeThumbnails4 makes thumbnails for the specified files in parallel. 
// It returns an error if any step failed. 
func makeThumbnails4(filenames []string) error { 

errors := make(chan error) 


for _, f := range filenames { 
go func(f string) { 
_, err := thumbnail. ImageFile(f) 


errors < err 


}(f) 


for range filenames { 
if err := <-errors; err != nil { 
return err // NOTE: incorrect: goroutine leak! 


return nil 


这 个 程序 有 一 个 微 秒 的 bug。 当 它 遇 到 第 一 个 非 nil 的 error 时 会 直接 将 error 返 回 到 调用 方 ， 使 得 

e channel ° 3 ## $] F 49worker goroutine 在 向 这 个 channel 中 发 

送 值 时 ， 都 会 永远 地 阻塞 下 去 ， 并 且 永 远 都 不 会 退出 。 这 种 情况 叫做 goroutine 泄 露 (S$S8.4.4)， 
可 能 会 导致 整个 程序 卡 住 或 者 跑 出 out of memory 的 错误 。 


最 简单 的 解决 办 法 就 是 用 一 个 具有 合适 大 小 的 buffered channel， 这 样 这 些 worker goroutine 向 
channel 中 发 送 测 向 时 就 不 会 被 阻塞 。( 一 个 可 选 的 解决 办 法 是 创建 一 个 另外 的 goroutine， 当 
main goroutine 返 回 第 一 个 错误 的 同时 去 排 室 channel) 


下 一 个 版 本 的 makeThumbnails 使 用 了 一 个 buffered channel 来 返回 生成 的 图 片 文件 的 名 字 ， 
附带 生成 时 的 错误 。 


// makeThumbnails5 makes thumbnails for the specified files in parallel. 
// It returns the generated file names in an arbitrary order, 
// or an error if any step failed. 
func makeThumbnails5(filenames []string) (thumbfiles []string, err error) { 
type item struct { 
thumbfile string 


err error 
} 
ch := make(chan item, len(filenames) ) 
for _, f := range filenames { 
go func(f string) { 
var it item 
it.thumbfile, it.err = thumbnail. ImageFile(f) 
ch <- it 
}(f) 
} 
for range filenames { 
it := <-ch 
if it.err != nil { 
return nil, it.err 
} 
thumbfiles = append(thumbfiles, it.thumbfile) 
} 


return thumbfiles, nil 


我 们 最 后 一 个 版 本 的 makeThumbnails 返 回 了 新 文件 们 的 大 小 总 计数 (bytes)。 和 前 面 的 版 本 都 
不 一 样 的 一 点 是 我 们 在 这 个 版 本 里 没有 把 文件 名 放 在 slice 里 ， 而 是 通过 一 个 string 的 channel 
传 过 来 ， 所 以 我 们 无 法 对 循环 的 次 数 进行 预测 。 


为 了 知道 最 后 一 个 goroutine 什 么 时 候 结 束 (最 后 一 个 结束 并 不 一 定 是 最 后 一 个 开始 )， 我 们 需要 
一 个 递增 的 计数 器 ， 在 每 一 个 goroutine 启 动 时 加 一 ， 在 goroutine 退 出 时 减 一 。 这 需要 一 种 特 
殊 的 计数 器 ， 这 个 计数 器 需要 在 多 个 goroutine 操 作 时 做 到 安全 并 且 提 供 提供 在 其 减 为 零 之 前 
一 直 等 待 的 一 种 方法 。 这 种 计数 类 型 被 称 为 sync.WaitGroup， 下 面 的 代码 就 用 到 了 这 种 方 

法 : 


// makeThumbnails6 makes thumbnails for each file received from the channel. 
// It returns the number of bytes occupied by the files it creates. 
func makeThumbnails6(filenames <-chan string) int64 { 
sizes := make(chan int64) 
var wg sync.WaitGroup // number of working goroutines 
for f := range filenames { 
wg .Add( 1) 
// worker 
go func(f string) { 
defer wg.Done() 
thumb, err := thumbnail. ImageFile(f) 


if err != nil { 
log.Println(err) 
return 
} 
info, _ := os.Stat(thumb) // OK to ignore error 
sizes <- info.Size() 
}(f) 
} 
// closer 
go func() { 
wg .Wait() 
close(sizes) 
}() 


var total int64 
for size := range sizes { 
total += size 


} 


return total 


注意 Add 和 Done 方 法 的 不 对 策 。Add 是 为 计数 器 加 一 ， 必 须 在 worker goroutine 开 始 之 前 调 

用 ， 而 不 是 在 goroutine 中 ; 否则 的 话 我 们 没 办 法 确定 Add 是 在 "closer" goroutine 调 用 Wait 之 前 
被 调用 。 并 且 Add 还 有 一 个 参数 ， 但 Done 却 没有 任何 参数 ; 其 实 它 和 Add(-1) 是 等 价 的 。 我 们 
使 用 defer 来 确保 计数 器 即使 是 在 出 错 的 情况 下 依然 能 够 正确 地 被 减 掉 。 上 面 的 程序 代码 结构 

是 当 我 们 使 用 并 发 循环 ， 但 又 不 知道 迭代 次 数 时 很 通常 而 且 很 地 道 的 写法 。 


sizes channel 携 带 了 每 一 个 文件 的 大 小 到 main goroutine， 在 main goroutine 中 使 用 了 range 
loop 来 计算 总 和 。 观 察 一 下 我 们 是 怎样 创建 一 个 closer goroutine ， 并 让 其 等 待 worker 们 在 关 
闭 掉 sizes channel 之 前 退出 的 。 两 步 操 作 : wait 和 close， 必 须 是 基于 sizes 的 循环 的 并 发 。 考 
虑 一 下 另 一 种 方案 : 如 果 等 待 操作 被 放 在 了 main goroutine 中 ， 在 循环 之 前 ， 这 样 的 话 就 永远 
都 不 会 结束 了 ， 如 果 在 循环 之 后 ， 那 么 又 变 成 了 不 可 达 的 部 分 ， 因 为 没有 任何 东西 去 关闭 这 
个 channel， 这 个 循环 就 永远 都 不 会 终止 。 


图 8.5 表明 了 makethumbnails6 有 函数 中 事件 的 序列 。 纵 列表 示 goroutine。 窒 线段 代表 sleep ， 
粗 线段 代表 活动 。 斜 线 箭头 代表 用 来 同步 两 个 goroutine 的 事件 。 时 间 向 下 流动 。 注 意 main 
goroutine 是 如 何 大 部 分 的 时 间 被 唤醒 执行 其 range 循 环 ， 等 待 worker 发 送 值 或 者 closer 来 关闭 


channel 的 。 


main 


Workers 


- range loop 





Figure 8.5. The sequence of events in makeThumbnails6. 


练习 8.4: 修改 reverb2 服 务 器 ， 在 每 一 个 连接 中 使 用 sync.WaitGroup 来 计数 活跃 的 echo 
goroutine。 当 计数 减 为 零 时 ， 关 闭 TCP 连 接 的 写 入 ， 像 练习 8.3 中 一 样 。 验 证 一 下 你 的 修改 版 
netcat3 客 户 端 会 一 直 等 待 所 有 的 并 发 "喊叫 "完成 ， 即 使 是 在 标准 输入 流 已 经 关闭 的 情况 下 。 
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练习 8.5: 使 用 一 个 已 有 的 CPU 绑 定 的 顺序 程序 ， 比 如 在 3.3 节 中 我 们 写 的 Mandelbrot 程 序 或 
者 3.2 节 中 的 3-D surface 计 算 程序 ， aka 的 主 循环 改 为 并 发 形式 ， 使 用 channel 来 进行 通 
信 。 在 多 核 计 算 机 上 这 个 程序 得 到 了 多 少 速 度 上 的 改进 ?使 用 多 少 个 goroutine 是 最 合适 的 


呢 ? 


8.6. 示例 : 并 发 的 Web 尺 忠 


在 5.6 节 中 ， 我 们 做 了 一 个 简单 的 web 人 疏 贝 ， 用 bfs( 广 度 优 先 ) 算 法 来 抓 取 整 个 网 站 。 在 本 节 
中 ， 我 们 会 让 这 个 这 个 候 虫 并 行 化 ， 这 样 每 一 个 彼此 独立 的 抓 取 命令 可 以 并 行进 行 IO， 最 大 
化 利用 网 络 资源 。crawl 部 数 和 gopl.io/ch5/findlinks3 中 的 是 一 样 的 。 


gopl.io/ch8/crawl1 


func crawl(url string) []string { 
fmt.Println(url) 
list, err := links.Extract(url) 
if err != nil { 
log.Print(err) 
} 


return list 


主 函 数 和 5.6 节 中 的 breadthFirst( 深 度 优先 ) 类 似 。 像 之 前 一 样 ， 一 个 worklist 是 一 个 记录 了 需要 
处 理 的 元 素 的 队列 ， 每 一 个 元 素 都 是 一 个 需要 抓 取 的 URL 列 表 ， 不 过 这 一 次 我 们 用 channel 代 
替 slice 来 做 这 个 队列 。 每 一 个 对 crawl 的 调用 都 会 在 他 们 自己 的 goroutine 中 进行 并 且 会 把 他 们 
抓 到 的 链接 发 送 回 worklist。 


func main() { 
worklist := make(chan []string) 


// Start with the command-line arguments. 


go func() { worklist <- os.Args[i:] }() 


// Crawl the web concurrently 

seen := make(map[string]bool) 

for list := range worklist { 

for _, link := range list { 
if !seen[link] { 
seen[link] = true 
go func(link string) { 
worklist <- crawl(link) 

}(link) 


注意 这 里 的 crawl 所 在 的 goroutine 会 将 link 作 为 一 个 显 式 的 参数 传 入 ， 来 避免 “循环 变量 快照 ”的 
问题 (在 5.6.1 中 有 讲解 )。 另 外 注意 这 里 将 命令 行 参数 传 入 worklist 也 是 在 一 个 另外 的 goroutine 
中 进行 的 ， 这 是 为 了 避免 在 main goroutine 和 crawler goroutine 中 同时 向 另 一 个 goroutine 通 过 


channe| 发 送 内 容 时 发 生死 锁 (因为 另 一 边 的 接收 操作 还 没有 准备 好 )。 当 然 ， 这 里 我 们 也 可 以 
M buffered channel 来 解决 问题 ， 这 里 不 再 孝 述 。 


现在 斥 虫 可 以 高 并 发 地 运行 起 来 ， 并 且 可 以 产生 一 大 坨 的 URL 了 ， 不 过 还 是 会 有 俩 问题 。 一 
个 问题 是 在 运行 一 段 时 间 后 可 能 会 出 现在 log 的 错误 信息 里 的 : 


$ go build gopl.io/ch8/crawl1i 
$ ./crawli http://gopl.io/ 
http://gopl.io/ 
https://golang.org/help/ 
https://golang.org/doc/ 
https://golang.org/blog/ 


2015/07/15 18:22:12 Get ...: dial tcp: lookup blog.golang.org: no such host 
2015/07/15 18:22:12 Get ...: dial tcp 23.21.222.120:443: socket: too many open files 


v 


最 初 的 错误 信息 是 一 个 让 人 英名 的 DNS 查找 失败 ， 即 使 这 个 域名 是 完全 可 靠 的 。 而 随后 的 错 
误 信 息 揭示 了 原因 : 这 个 程序 一 次 性 创建 了 太 多 网 络 连接 ， 超 过 了 每 一 个 进程 的 打开 文件 数 
限制 ， 既 而 导致 了 在 调用 net.Dial 像 DNS 查找 失败 这 样 的 问题 。 


这 个 程序 实在 是 太 他 妈 并 行 了 。 无 穷 无 尽 地 并 行 化 并 不 是 什么 好 事情 ， 因 为 不 管 怎么 说 ， 你 
的 系统 总 是 会 有 一 个 些 限制 因素 ， 比 如 CPU 核 心 数 会 限制 你 的 计算 负载 ， 比 如 你 的 硬盘 转轴 
和 磁头 数 限制 了 你 的 本 地 磁盘 IO 操作 频 府 ， 比 如 你 的 网 络 带宽 限制 了 你 的 下 载 速度 上 限 ， 或 
者 是 你 的 一 个 web 服 务 的 服务 容量 上 限 等 等 。 为 了 解决 这 个 问题 ， 我 们 可 以 限制 并 发 程序 所 使 
用 的 资源 来 使 之 适应 自己 的 运行 环境 。 对 于 我 们 的 例子 来 说 ， 最 简单 的 方法 就 是 限制 对 
links.Extract 在 同一 时 间 最 多 不 会 有 超过 n 次 调用 ， 这 里 的 n 是 fd 的 limit-20， 一 般 情 况 下 。 

一 个 夜店 里 限制 客人 数目 是 一 个 道理 ， 只 有 当 有 客人 离开 时 ， 才 会 允许 新 的 客人 进 eae 
注 ERARA RR) © 


我 们 可 以 用 一 个 有 容量 限制 的 buffered channel 来 控制 并 发 ， 这 类 似 于 操作 系统 里 的 计数 信号 
量 概念 。 从 概念 上 讲 ，channel 里 的 n 个 空 楷 代 表 n 个 可 以 处 理 内 容 的 token( 通 行 证 )， 从 
channel 里 接收 一 个 值 会 释放 其 中 的 一 个 token， 并 且 生 成 一 个 新 的 空 档 位 。 这 样 保证 了 在 没 
有 接收 介入 时 最 多 有 n 个 发 送 操作 。( 这 里 可 能 我 们 拿 channel 里 填充 的 槽 来 做 token 更 直观 一 
些 ， 不 过 还 是 这 样 吧 ~)。 由 于 channel 里 的 元 素 类 型 并 不 重要 ， 我 们 用 一 个 零 值 的 struct{f} 来 作 
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确保 同一 时 间 对 其 只 有 20 个 调用 。 信 号 量 数量 和 其 能 操作 的 IO 资源 数量 应 保持 接近 。 


gopl.io/ch8/crawl2 


// tokens is a counting semaphore used to 
// enforce a limit of 20 concurrent requests. 
var tokens = make(chan struct{}, 20) 


func crawl(url string) []string { 
fmt.Println(url) 
tokens <- struct{}{} // acquire a token 
list, err := links.Extract(url) 
<-tokens // release the token 
if err != nil { 

log.Print(err) 

} 


return list 


第 二 个 问题 是 这 个 程序 永远 都 不 会 终止 ， 即 使 它 已 经 候 到 了 所 有 初始 链接 往生 出 的 链接 。( 当 
然 ， 除 非 你 懂 重 地 选择 了 合适 的 初始 化 URL 或 者 已 经 实现 了 练习 8.6 中 的 深度 限制 ， 你 应 该 还 
没有 意识 到 这 个 问题 )。 为 了 使 这 个 程序 能 够 终止 ， 我 们 需要 在 worklist 为 空 或 者 没有 crawl 的 
goroutine 在 运行 时 退出 主 循环 。 


func main() { 
worklist := make(chan []string) 
var n int // number of pending sends to worklist 


// Start with the command-line arguments. 
n+ 十 


go func() { worklist <- os.Args[i:] }() 


// Crawl the web concurrently. 
seen := make(map[string]bool) 


for ; n> 0; n-- { 
list := <-worklist 
for _, link := range list { 
if !seen[link] { 
seen[link] = true 
n++ 
go func(link string) { 
worklist <- crawl(link) 

}(link) 
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送 到 worklist 时 ， 我 们 都 会 对 n 进 行 ++ 操 作 ， 在 向 worklist 中 发 送 初始 的 命令 行 参数 之 前 ， 我 们 
也 进行 过 一 次 ++ 操 作 。 这 里 的 操作 ++ 是 在 每 启动 一 个 crawler 的 goroutine 之 前 。 主 循环 会 在 n 


减 为 0 时 终止 ， 这 时 候 说 明 没 活 可 干 了 。 
现在 这 个 并 发 慌 虫 会 比 5.6 节 中 的 深度 优先 搜索 版 快 上 20 倍 ， 而 且 不 会 出 什么 错 ， 并 且 在 其 完 
成 任务 时 也 会 正确 地 终止 。 


下 面 的 程序 是 避免 过 度 并 发 的 另 一 种 思路 。 这 个 版 本 使 用 了 原来 的 crawl 辑 数 ， 但 没有 使 用 计 
数 信号 量 ， 取 而 代 之 用 了 20 个 长 活 的 crawler goroutine， 这 样 来 保证 最 多 20 个 HTTP 请 求 在 并 
发 。 


func main() { 
worklist := make(chan []string) // lists of URLs, may have duplicates 
unseenLinks := make(chan string) // de-duplicated URLS 


// Add command-line arguments to worklist. 
go func() { worklist <- os.Args[i:] }() 


// Create 20 crawler goroutines to fetch each unseen link. 


FOR 1 = 07 1 <= 20), ath a 
go func() { 
for link := range unseenLinks { 
foundLinks := crawl(link) 
go func() { worklist <- foundLinks }() 
} 
}() 


// The main goroutine de-duplicates worklist items 
// and sends the unseen ones to the crawlers. 
seen := make(map[string]bool) 
for list := range worklist { 
for _, link := range list { 
if !seen[link] { 
seen[link] = true 
unseenLinks <- link 


PR A KI E & goroutine2L # 4B Æ 4% F — *+channel-unseenLinks"x 4249 J °> Zgoroutine f i HFA 
它 从 worklist 里 拿 到 的 元 素 ， 然 后 把 没有 抓 过 的 经 由 unseenLinks channel £ 3% 28 — WK R ig 
goroutine ° 


seen 这 个 map 被 限定 在 main goroutine 中 ; 也 就 是 说 这 个 map 只 能 在 main goroutine 中 进行 访 
问 。 类 似 于 其 它 的 信息 隐藏 方式 ， 这 样 的 约束 可 以 让 我 们 从 一 定 程度 上 保证 程序 的 正确 性 。 
例如 ， 内 部 变量 不 能 够 在 函数 外 部 被 访问 到 ; 变量 (§2.3.4) 在 没有 被 转 义 的 情况 下 是 无 法 在 隐 
AE 问 的 ; 一 个 对 象 的 封装 字段 无 法 被 该 对 象 的 方法 以 外 的 方法 访问 到 。 在 所 有 的 情况 
下 ， 信 息 隐 藏 都 可 以 帮助 我 们 约束 我 们 的 程序 ， 使 其 不 发 生意 料 之 外 的 情况 。 
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跳 转 三 次 以 内 能 够 跳 到 的 页 面 才 能 被 抓 取 到 。 


练习 8.7 : 完成 一 个 并 发 程序 来 创建 一 个 线 上 网 站 的 本 地 镜像 ， 把 该 站 点 的 所 有 可 达 的 页 面 
都 抓 取 到 本 地 硬盘 。 为 了 省 事 ， 我 们 这 里 可 以 只 取出 现在 该 域 下 的 所 有 页 面 (比如 golang.org 
结尾 ， 译 注 : 外 链 的 应 该 就 不 算 了 。) 当 然 了 ， 出 现在 页 面 里 的 链接 你 也 需要 进行 一 些 处 理 ， 
使 其 能 够 在 你 的 镜像 站 点 上 进行 跳 转 ， 而 不 是 指向 原始 的 链接 。 


译注 : 拓展 阅读 Handling 1 Million Requests per Minute with Go ° 


8.7. 基于 select 的 多 路 复 用 


下 面 的 程序 会 进行 火箭 发 射 的 倒计时 。time.Tick 有 函数 返回 一 个 channel， 程 序 会 周期 性 地 像 一 
个 节拍 器 一 样 向 这 个 channel| 发 送 事 件 。 每 一 个 事件 的 值 是 一 个 时 间 惟 ， 不 过 更 有 意思 的 是 其 
传送 方式 。 


gopl.io/ch8/countdown1 


func main() { 

fmt.Println("Commencing countdown.") 

tick := time.Tick(i * time.Second) 

for countdown := 10; countdown > 0; countdown-- { 
fmt .Println( countdown) 
j<-tick 

} 

launch() 


现在 我 们 让 这 个 程序 支持 在 倒计时 中 ， 用 户 按 下 return 键 时 直接 中 断 发 射流 程 。 首 先 ， 我 们 局 
动 一 个 goroutine， 这 个 goroutine 会 尝试 从 标准 输入 中 调 入 一 个 单独 的 byte 并 且 ， 如 果 成 功 
了 ， 会 向 名 为 abort 的 channel 发 送 一 个 值 。 


gopl.io/ch8/countdown2 


abort := make(chan struct{}) 

go func() { 
os.Stdin.Read(make([]byte, 1)) // read a single byte 
abort <- struct{}{} 

}() 


现在 每 一 次 计数 循环 的 迭代 都 需要 等 待 两 个 channel 中 的 其 中 一 个 返回 事件 了 : ticker channel 
当 一 切 正常 时 (就 像 NASAjorgon 的 "nominal"， 译 注 : 这 梗 估 计 我 们 是 不 履 了 ) 或 者 弄 常 时 返回 
的 abort 事 件 。 我 们 无 法 做 到 从 每 一 个 channel 中 接收 信息 ， 如 果 我 们 这 么 做 的 话 ， 如 果 第 一 个 
channel 中 没有 事件 发 过 来 那么 程序 就 会 立刻 被 阻塞 ， 这 样 我 们 就 无 法 收 到 第 二 个 channel 中 
发 过 来 的 事件 。 这 时 候 我 们 需要 多 路 复 用 (multiplex) 这 些 操作 了 ， 为 了 能 够 多 路 复 用 ， 我 们 使 
Fl T selecti& 4) © 


select { 
case <-ch1: 
Ue 5.0 
case X := <-ch2: 
We oo WES 880 0 
case ch3 <- y: 
Tile aa: 
default: 
CA 


上 面 是 select 语 名 的 一 般 形式 。 和 switch 语 名 稍微 有 点 相似 ， 也 会 有 几 个 case 和 最 后 的 default 

选择 支 。 每 一 个 case 代 表 一 个 通信 操作 (在 茶 个 channel 上 进行 发 送 或 者 接收 ) 并 且 会 包含 一 些 
语句 组 成 的 一 个 语句 块 。 一 个 接收 表达 式 可 能 只 包含 接收 表达 式 自身 (译注 : 不 把 接收 到 的 值 
赋值 给 变量 什么 的 )， 就 像 上 面 的 第 一 个 case， 或 者 包含 在 一 个 简短 的 变量 声明 中 ， 像 第 二 个 
case 里 一 样 ; 第 二 种 形式 让 你 能 够 引用 接收 到 的 值 。 


Selecta TCAE a a eea ie 。 当 条 件 满足 时 ，select 才 会 去 通信 并 执行 
case 之 后 的 语句 ; 这 时 候 其 言 是 不 会 执行 的 。 一 个 没有 任何 case 的 Select 语 名 写作 
select} > AK% ano 


让 我 们 回 到 我 们 的 火箭 发 射程 序 。time.After 函 数 会 立即 返回 一 个 channel， 并 起 一 个 新 的 
goroutine 在 经 过 特定 的 时 间 后 向 该 channel 发 送 一 个 独立 的 值 。 下 面 的 select 语 名 会 会 一 直 
待 到 两 个 事件 中 的 一 个 到 达 ， 无 论 是 abort 事 件 或 者 一 个 10 秒 经 过 的 事件 。 如 果 10 秒 经 过 了 
没有 abort 事 件 进 入 ， 那 么 火箭 就 会 发 射 


等 
还 


func main() { 
// ...create abort channel... 


fmt.Println("Commencing countdown. Press return to abort.") 
select { 
case <-time.After(10 * time.Second): 
// Do nothing. 
case <-abort: 
fmt.Println("Launch aborted!") 
return 


} 
launch() 


下 面 这 个 例子 更 微 秒 。ch 这 个 channel 的 buffer 大 小 是 1， 所 以 会 交替 的 为 空 或 为 满 ， 所 以 只 有 
一 个 case 可 以 进行 下 去 ， 无 论 j 是 奇数 或 者 偶数 ， 它 都 会 打印 02468。 


ch := make(chan int, 1) 


fori := 0; I< 10; itt fi 
select { 
case x := <-ch: 


fmt.Println(x) // "o" "2" "4" "ge" ugu 
case ch <- i: 


} 


如 果 多 个 case 同 时 就 绪 时 ，select 会 随机 地 选择 一 个 执行 ， 这 样 来 保证 每 一 个 channel 都 有 平 
等 的 被 select 的 机 会 。 增 加 前 一 个 例子 的 buffer 大 小 会 使 其 输出 变 得 不 确定 ， 因 为 当 buffer 既 不 
为 满 也 不 为 室 时 ，select 语 名 的 执行 情况 就 像 是 抛 硬 币 的 行为 一 样 是 随机 的 。 


下 面 让 我 们 的 发 射程 序 打 印 倒计时 。 这 里 的 select 语 名 会 使 每 次 循环 迭代 等 待 一 秒 来 执行 退出 
操作 。 


gopl.io/ch8/countdown3 


func main() { 


// ...create abort channel... 


fmt.Println("Commencing countdown. Press return to abort.") 
tick := time.Tick(i * time.Second) 
for countdown := 10; countdown > 0; countdown-- { 
fmt .Println( countdown) 
select { 
case <-tick: 
// Do nothing. 
case <-abort: 
fmt.Println("Launch aborted!") 
return 
} 
} 
launch() 


time.Tick 函 数 表现 得 好 像 它 创建 了 一 个 在 循环 中 调用 time.Sleep 的 goroutine， 每 次 被 唤醒 时 发 
送 一 个 事件 。 当 countdown 函 数 返回 时 ， 它 会 停止 从 tick 中 接收 事件 ， 但 是 ticker 这 个 goroutine 
还 依然 存活 ， 继 续 徒 劳 地 尝试 从 channel 中 发 送 值 ， 然 而 这 时 候 已 经 没有 其 它 的 goroutine 会 从 
该 channel 中 接收 值 了 -- 这 被 称 为 goroutine 泄 露 ($8.4.4) 。 


Tick 函 数据 方便 ， 但 是 只 有 当 程 序 整个 生命 周期 都 需要 这 个 时 间 时 我 们 使 用 它 才 比较 合适 。 和 否 
则 的 话 ， 我 们 应 该 使 用 下 面 的 这 种 模式 : 


ticker := time.NewTicker(i * time.Second) 
<-ticker.C // receive from the ticker's channel 


ticker.Stop() // cause the ticker's goroutine to terminate 


有 时 候 我 们 希望 能 够 从 channel 中 发 送 或 者 接收 值 ， 并 避免 因为 发 送 或 者 接收 导致 的 阻塞 ， 万 
其 是 当 channel 没 有 准备 好 写 或 者 读 时 。select 语 名 就 可 以 实现 这 样 的 功能 。select 会 有 一 个 
default 来 设置 当 其 它 的 操作 都 不 能 够 马上 被 处 理 时 程序 需要 执行 哪些 逻辑 。 


F @ 4 selectié 47 4 abort channel 中 有 值 时 ， 从 其 中 接收 值 ; 无 值 时 什么 都 不 做 。 这 是 一 个 
非 阻 塞 的 接收 操作 ; 反复 地 做 这 样 的 操作 叫做 “ 轮 询 channel”。 


select { 

case <-abort: 
fmt.Printf("Launch aborted! \n") 
return 

default: 
// do nothing 


channel 的 零 值 是 hil。 也 许 会 让 你 觉得 比较 奇怪 ，nil 的 channel 有 时 候 也 是 有 一 些 用 处 的 。 
为 对 一 个 nil 的 channel 发 送 和 接收 操作 会 永远 阻塞 ， 在 select 语 句 中 操作 nil 的 channel 永 远 都 不 
会 被 select 到 。 


这 使 得 我 们 可 以 用 nil 来 激活 或 者 禁用 case， 来 达成 处 理 其 它 输 入 或 输出 事件 时 超时 和 取消 的 
逻辑 。 我 们 会 在 下 一 节 中 看 到 一 个 例子 。 


练习 8.8: 使 用 select 来 改造 8.3 节 中 的 echo 服 务 器 ， 为 其 增加 超时 ， 这 样 服务 器 可 以 在 客户 
端 10 秒 中 没有 任何 喊话 时 自动 断 开 连接 。 


8.8. 示例 : 并 发 的 字典 遍历 


在 本 小 节 中 ， 我 们 会 创建 一 个 程序 来 生成 指定 目 sie pet ean ， 这 个 程序 和 Unix 里 
的 du 工具 比较 相似 。 大 多 数 工 作用 下 面 这 个 walkDir 函 数 来 完成 ， 函数 使 用 dirents 有 函数 来 
枚 举 一 个 目录 下 的 所 有 入 口 。 


gopl.io/ch8/du1 


// walkDir recursively walks the file tree rooted at dir 
// and sends the size of each found file on fileSizes. 
func walkDir(dir string, fileSizes chan<- int64) { 
for _, entry := range dirents(dir) { 
if entry.IsDir() { 
subdir := filepath.Join(dir, entry.Name()) 
walkDir(subdir, fileSizes) 
} else { 
fileSizes <- entry.Size() 


} 
} 
} 
// dirents returns the entries of directory dir. 
func dirents(dir string) []Jos.FileInfo { 
entries, err := ioutil.ReadDir(dir) 
if err != nil { 
fmt.Fprintf(os.Stderr, "dui: %v\n", err) 
return nil 
} 
return entries 
} 
ioutil.ReadDir 4 %& 47% © — 40s.FilelnfoX # “slice ，os.FileInfo 类 型 也 是 os.Stat 这 个 函数 的 
返回 值 。 对 每 一 个 子 目录 而 言 ，wWalkDir 会 递归 地 调用 其 自 4 ， 并且 会 对 每 一 个 文件 也 北 归 调 
用 。walkDir 函 数 会 向 fileSizes 这 个 channel 发 送 一 条 消息 。 这 条 消息 包含 了 文件 的 字 节 大 小 。 


下 面 的 主 函 数 ， 用 了 两 个 goroutine。 后 台 的 goroutine 调 用 walkDir 来 遍历 命令 行 给 出 的 每 一 个 


路 径 并 最 终 关闭 fileSizes 这 个 channel。 主 goroutine 会 对 其 从 channel 中 接收 到 的 文件 大 小 进行 
累加 ， 并 输出 其 和 。 


package main 


import ( 
efile 
ae 
oO lO Uitte 
Nos" 
"path/filepath" 


func main() { 
// Determine the initial directories. 
flag.Parse() 
roots := flag.Args() 
if len(roots) == 0 { 
roots = []string{"."} 


// NGaversemchnerhpElesEnee!. 
fileSizes := make(chan int64) 
go func() { 
for _, root := range roots { 
walkDir(root, fileSizes) 
} 


close(fileSizes) 


}() 


// erint the results: 

var nfiles, nbytes int64 

for size := range fileSizes { 
nfiles++ 
nbytes += size 

} 

printDiskUsage(nfiles, nbytes) 


func printDiskUsage(nfiles, nbytes int64) { 
fmt.Printf("%d files %.1f GB\n", nfiles, float64(nbytes)/1e9) 


这 个 程序 会 在 打印 其 结果 之 前 卡 住 很 长 时 间 。 


$ go build gopl.io/ch8/du1 
$ ./du1 $HOME /usr /bin /etc 
213201 files 62.7 GB 


如 果 在 运行 的 时 候 能 够 让 我 们 知道 处 理 进度 的 话 想必 更 好 。 但 是 ， 如 果 简 单 地 把 
printDiskUsage 亏 数 调 用 移动 到 循环 里 会 导致 其 打印 出 成 百 上 千 的 输出 。 


下 面 这 个 du 的 变种 会 间歇 打印 内 容 ， 不 过 只 有 在 调用 时 提供 了 -v 的 flag 才 会 显示 程序 进度 信 
息 。 在 roots 目 录 上 循环 的 后 台 goroutine 在 这 里 保持 不 变 。 主 goroutine 现 在 使 用 了 计时 器 来 每 
500ms 生 成 事件 ， 然 后 用 select 语 名 来 等 待 文件 大 小 的 消息 来 更 新 总 大 小 数据 ， 或 者 一 个 计时 
器 的 事件 来 打印 当前 的 总 大 小 数据 。 如 果 -v 的 flag 在 运行 时 没有 传 入 的 话 ，tick 这 个 channel 会 
保持 为 nil ， 这 样 在 select 里 的 case 也 就 相当 于 被 禁用 了 。 
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var verbose = flag.Bool("v", false, "show verbose progress messages") 


func main() { 


// ...Start background goroutine.. 


// Print the results periodically. 
var tick <-chan time.Time 
if *verbose { 
tick = time.Tick(500 * time.Millisecond) 


} 
var nfiles, nbytes int64 
loop: 
for { 
select { 
case size, ok := <-fileSizes: 
if !ok { 
break loop // fileSizes was closed 
} 
nfiles++ 
nbytes += size 
case <-tick: 
printDiskUsage(nfiles, nbytes) 
} 
} 


printDiskUsage(nfiles, nbytes) // final totals 


由 于 我 们 的 程序 不 再 使 用 range 循 环 ， 第 一 个 select 的 case 必 须 显 式 地 判断 fleSizes 的 channel 
是 不 是 已 经 被 关闭 了 ， 这 里 可 以 用 到 channel 接 收 的 二 值 形式 。 如 果 channel 已 经 被 关闭 了 的 
话 ， 程 序 会 直接 退出 循环 。 这 里 的 break 语 名 用 到 了 标签 break， 这 样 可 以 同时 终结 select 和 for 
两 个 循环 ; 如 果 没 有 用 标签 就 break 的 话 只 会 退出 内 层 的 select 循 环 ， 而 外 层 的 for 循 环 会 使 之 
进入 下 一 轮 select 循 环 。 


现在 程序 会 悠闲 地 为 我 们 打印 更 新 流 : 


$ go build gopl.io/ch8/du2 

$ ./du2 -v $HOME /usr /bin /etc 
28608 files 8.3 GB 

54147 files 10.3 GB 

93591 files 15.1 GB 

127169 files 52.9 GB 

175931 files 62.2 GB 

213201 files 62.7 GB 


然而 这 个 程序 还 是 会 花 上 很 长 时 间 才 会 结束 。 无 法 对 walkDir 做 并 行 化 处 理 没 什么 别 的 原因 ， 

无 非 是 因为 磁盘 系统 并 行 限 制 。 下 面 这 个 第 三 个 版 本 的 du， 会 对 每 一 个 walkDir 的 调用 创建 一 
个 新 的 goroutine。 它 使 用 sync.WaitGroup (S8.5) 来 对 仍旧 活跃 的 walkDir 调 用 进行 计数 ， 另 一 
个 goroutine 会 在 计数 器 减 为 零 的 时 候 将 fleSizes 这 个 channel 关 闭 。 
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func main() { 


// ...determine roots... 





// Traverse each root of the file tree in parallel. 
fileSizes := make(chan int64) 
var n sync.WaitGroup 
for _, root := range roots { 
n.Add(1) 
go walkDir(root, &n, fileSizes) 
} 
go func() { 
n.Wait() 
close(fileSizes) 


func walkDir(dir string, n *sync.WaitGroup, fileSizes chan<- int64) { 
defer n.Done() 
for _, entry := range dirents(dir) { 
if entry.IsDir() { 
n.Add(1) 
subdir := filepath.Join(dir, entry.Name()) 
go walkDir(subdir, n, fileSizes) 
} else { 
fileSizes <- entry.Size() 


u TERE SSH SO] 2 KG EF goroutine > RM A SF rdirents HA > AHAA 5 
量 来 阻止 他 同时 打开 太 多 的 文件 ， 就 像 我 们 在 8.7 节 中 的 并 发 展 虫 一 样 : 


// sema is a counting semaphore for limiting concurrency in dirents. 
var sema = make(chan struct{}, 20) 


// dirents returns the entries of directory dir. 
func dirents(dir string) []Jos.FileInfo { 


sema <- struct{}{} // acquire token 
defer func() { <-sema }() // release token 
UWE pea 


这 个 版 本 比 之 前 那个 快 了 好 几 倍 ， 尽 管 其 具体 效率 还 是 和 你 的 运行 环境 ， 机 器 配置 相关 。 


练习 8.9: 编写 一 个 du 工具 ， 每 隔 一 段 时 间 将 root 目 录 下 的 目录 大 小 计算 并 显示 出 来 。 


8.9. 并 发 的 退出 


有 时 候 我 们 需要 通知 goroutine 停 止 它 正在 干 的 事情 ， 比 如 一 个 正在 执行 计算 的 web 服 务 ， 然 
而 它 的 客户 端 已 经 断 开 了 和 服务 端的 连接 。 


Go 语言 并 没有 提供 在 一 个 goroutine 中 终止 另 一 个 goroutine 的 方法 ， 由 于 这 样 会 导致 goroutine 
之 间 的 共享 变量 落 在 未 定义 的 状态 上 。 在 8.7 节 中 的 rocket launch 程 序 中 ， 我 们 往 名 字 叫 abort 
的 channel 里 发 送 了 一 个 简单 的 值 ， 在 countdown 的 goroutine 中 会 把 这 个 值 理解 为 自己 的 退出 
信号 。 但 是 如 果 我 们 想 要 退出 两 个 或 者 任意 多 个 goroutine 怎 么 办 呢 ? 


一 种 可 能 的 手段 是 向 abort 的 channel 里 发 送 和 goroutine 数 目 一 样 多 的 事件 来 退出 它们 。 如 果 
cece 已 经 有 一 些 自己 退出 了 ， 那 么 会 导致 我 们 的 channel 里 的 goroulinen 

这 样 导 致 我 们 的 发 送 直 接 被 阻塞 。 另 一 方面 ， 如 果 这 些 goroutine 又 生成 了 其 它 的 
stelle ， 我 们 的 channel 里 的 数目 又 太 少 了 ， 所 以 有 些 goroutine 可 能 会 无 法 接收 到 退出 消 
息 。 一 般 情况 下 我 们 是 很 难 知道 在 某 一 个 时 刻 具 体 有 多 少 个 goroutine 在 运行 着 的 。 当 
一 个 goroutine 从 abort channel 中 接收 到 一 个 值 的 时 候 ， 他 会 消费 掉 这 个 值 ， 这 样 其 它 的 
goroutine 就 没 法 看 到 这 条 信息 。 为 了 能 够 达到 我 们 退出 goroutine 的 目的 ， 我 们 需要 更 车 谱 的 
策略 ， 来 通过 一 个 channel 把 消息 广播 出 去 ， 这 样 goroutine 们 能 够 看 到 这 条 事件 消息 ， 并 且 在 
事件 完成 之 后 ， 可 以 知道 这 件 事 已 经 发 生 过 了 


回忆 一 下 我 们 关闭 了 一 个 channel 并 且 被 消费 掉 了 所 有 已 发 送 的 值 ， 操 作 channe| 之 后 的 代码 
可 以 立即 被 执行 ， 并 且 会 产生 零 值 。 我 们 可 以 将 这 个 机 制 扩 展 一 下 ， 来 作为 我 们 的 广播 机 
制 : 不 要 向 channel 发 送 值 ， 而 是 用 关闭 一 个 channel 来 进行 广播 。 


只 要 一 些小 修改 ， 我 们 就 可 以 把 退出 逻辑 加 入 到 前 一 节 的 du 程序 。 首 先 ， 我 们 创建 一 个 退出 
的 channel， 这 个 channel 不 会 向 其 de ， 但 其 所 在 的 闭 包 内 要 写 明 程序 需要 退出 。 
我 们 同时 还 定义 了 一 个 工具 部 数 ，cancelled， 这 个 函数 在 被 调用 的 时 候 会 轮 询 退 出 状态 。 


gopl.io/ch8/du4 


var done = make(chan struct{}) 


func cancelled() bool { 
select { 
case <-done: 
return true 
default: 
return false 


} 


下 面 我 们 创建 一 个 从 标准 输入 流 中 读 取 内 容 的 goroutine， 这 是 一 个 比较 典型 的 连接 到 终端 的 
程序 。 每 当 有 输入 被 读 到 (比如 用 户 按 了 回 车 键 )， 这 个 goroutine 就 会 把 取消 消息 通过 关闭 
done 的 channel 广 播 出 去 。 


// Cancel traversal when input is detected. 

go func() { 
os.Stdin.Read(make([]byte, 1)) // read a single byte 
close(done) 


+0) 


现在 我 们 需要 使 我 们 的 goroutine 来 对 取消 进行 响应 。 在 main goroutine 中 ， 我 们 添加 了 select 
的 第 三 个 case 语 句 ， 尝 试 从 done channel 中 接收 内 容 。 如 果 这 个 case 被 满足 的 话 ， 在 select 到 
的 时 候 即 会 返回 ， 但 在 结束 之 前 我 们 需要 把 fileSizes channel 中 的 内 容 “ 排 "? 空 ， 在 channel 被 关 
闭 之 前 ， 例 育 掉 所 有 值 。 这 样 可 以 保证 对 walkDir 的 调用 不 要 被 向 fleSizes 发 送信 息 阻塞 住 ， 
可 以 正确 地 完成 。 


for { 

select { 

case <-done: 
// Drain fileSizes to allow existing goroutines to finish. 
for range fileSizes { 

// Do nothing. 

} 
return 

case size, ok := <-fileSizes: 
LEE Be 

} 


walkDir 这 个 goroutine 一 启动 就 会 轮 询 取 消 状 态 ， 如 果 取 消 状态 被 设置 的 话 会 直接 返回 ， 并 且 
不 做 额外 的 事情 。 这 样 我 们 将 所 有 在 取消 事件 之 后 创建 的 goroutine 改 变 为 无 操作 。 
func walkDir(dir string, n *sync.WaitGroup, fileSizes chan<- int64) { 


defer n.Done() 
if cancelled() { 


return 

} 

for _, entry := range dirents(dir) { 
人 


在 walkDir 函 数 的 循环 中 我 们 对 取消 状态 进行 轮 询 可 以 带 来 明显 的 益处 ， 可 以 避免 在 取消 事件 
发 生 时 还 去 创建 goroutine。 取 消 本 身 是 有 一 些 代价 的 ; 想 要 快速 的 响应 需要 对 程序 逻辑 进行 
侵入 式 的 修改 。 确 保 在 取消 发 生 之 后 不 要 有 代价 太 大 的 操作 可 能 会 需要 修改 你 代码 里 的 很 多 


地 方 ， 但 是 在 一 些 重要 的 地 方 去 检查 取消 事件 也 确实 能 带 来 很 大 的 好 处 。 


对 这 个 程序 的 一 个 简单 的 性 能 分 析 可 以 揭示 瓶颈 在 dirents 函 数 中 获取 一 个 信号 量 。 下 面 的 
select 可 以 让 这 种 操作 可 以 被 取消 ， 并 且 可 以 将 取消 时 的 延迟 从 几 百 毫秒 降低 到 几 十 毫秒 。 


func dirents(dir string) []Jos.FileInfo { 
select { 
case sema <- struct{}{}: // acquire token 
case <-done: 
return nil // cancelled 


} 
defer func() { <-sema }() // release token 


Eo oir e%e! ClalictsYereoln ys oc 


ae 当 取 消 发 生 时 ， 所 有 后 台 的 goroutine 都 会 迅速 停止 并 且 主 函数 会 返回 。 当 然 ， 当 主 函 数 

返回 时 ， 一 个 程序 会 退出 ， 而 我 们 又 无 法 在 主 函 数 退 出 的 时 候 确认 其 已 经 释放 了 所 有 的 资源 
(译注 : 因为 程序 都 退出 了 ， 你 的 代码 都 没 法 执行 了 )。 这 里 有 一 个 方便 的 窍门 我 们 可 以 一 用 : 
取代 掉 直 接 从 主 函 数 返回 ， 我 们 调用 一 个 panic， pee a 
下 来 。 如 果 main goroutine 是 唯一 一 个 剩 下 的 goroutine 的 话 ， 他 会 清理 掉 自 己 的 一 切 资源 。 但 
是 如 果 还 有 其 an 
是 取消 操作 会 很 花 时 间 ; 所 以 这 里 的 一 个 调研 还 是 很 有 必要 的 。 我 们 用 panic 来 获取 到 足够 的 
信息 来 验证 我 们 上 面 的 判断 ， 看 看 最 终 到 底 是 什么 样 的 情况 。 


练习 8.10: HTTP 请 求 可 能 会 因 http.Request 结 构 体 中 Cancel channel 的 关闭 而 取消 。 修 改 
8.6 节 中 的 web crawler 来 支持 取消 http 请 求 。 (提示 : http.Get 并 没有 提供 方便 地 定制 一 个 请 
求 的 方法 。 你 可 以 用 http.NewRequest 来 取而代之 ， 设 置 它 的 Cancel 字 段 ， 然 后 用 
http.DefaultClient.Do(req) 来 进行 这 个 http 请 求 。) 


练习 8.11: 紧 接着 8.4.4 中 SmirroredQuery itz ， 实 现 一 个 并 发 请 求 url 的 fetch 的 变种 。 当 第 
一 个 请 求 返回 时 ， 直 接 取消 其 它 的 请 求 。 


8.10. 示例 : 聊天 服务 


我 们 用 一 个 聊天 服务 器 来 终结 本 章节 的 内 容 ， 这 个 程序 可 以 让 一 些 用 户 通过 服务 器 向 其 它 所 
有 用 户 广播 文本 消息 。 这 个 程序 中 有 四 种 goroutine。main 和 broadcaster 各 自 是 一 个 goroutine 
实例 ， 每 一 个 客户 端的 连接 都 会 有 一 个 handleConn 和 clientWriter 的 goroutine。broadcaster 是 
select 用 法 的 不 错 的 样 例 ， 因 为 它 需 要 处 理 三 种 不 同类 型 的 消息 。 


下 面 演示 的 main goroutine 的 工作 ， 是 listen 和 accept( 译 注 : 网 络 编程 里 的 概念 ) 从 客户 端 过 来 
的 连接 。 对 每 一 个 连接 ， 程 序 都 会 建立 一 个 新 的 handleConn 的 goroutine， 就 像 我 们 在 本 章 开 
头 的 并 发 的 echo 服 务 器 里 所 做 的 那样 。 
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func main() { 


listener, err := net.Listen("tcp", "localhost:8000") 
if err != nil { 
log.Fatal(err) 
} 
go broadcaster() 
for { 
conn, err := listener.Accept() 
if err != nil { 
log.Print(err) 
continue 
} 
go handleConn(conn) 
} 


3> 
W 


然后 是 broadcaster 的 goroutine。 他 的 内 部 变量 clients 会 记录 当前 建立 连接 的 客户 端 集 
记录 的 内 容 是 每 一 个 客户 端的 消息 发 出 channel 的 "资格 "信息 。 


type client chan<- string // an outgoing message channel 


var ( 
entering = make(chan client) 
leaving = make(chan client) 
messages = make(chan string) // all incoming client messages 


func broadcaster() { 


clients := make(map[client]bool) // all connected clients 
fom t 

select { 

case msg := <-messages: 


// Broadcast incoming message to all 
// clients' outgoing message channels. 
for cli := range clients { 

cli <- msg 


} 
case cli := <-entering: 
clients[cli] = true 


case cli := <-leaving: 
delete(clients, cli) 
close(cli) 


broadcaster 监 听 来 自 全 局 的 entering 和 leaving 的 channel 来 获知 客户 端的 到 来 和 离开 事件 。 当 
其 接收 到 其 中 的 一 个 事件 时 ， 会 更 新 clients 集 合 ， 当 该 事件 是 离开 行为 时 ， 它 会 关闭 客户 端的 
消息 发 出 channel。broadcaster 也 会 监听 全 局 的 息 channel， 所 有 的 客户 端 都 会 向 这 个 
channel 中 发 送 消息 。 当 broadcaster 接 收 到 什么 消息 时 ， 就 会 将 其 广播 至 所 有 连接 到 服务 端的 
客户 端 。 


现在 让 我 们 看 看 每 一 个 客户 端的 goroutine。handleConn 函 数 会 为 它 的 客户 端 创建 一 个 消息 发 
出 channel 并 通过 entering channel 来 通知 客户 端的 到 来 。 然 后 它 会 读 取 客户 端 发 来 的 每 一 行文 
本 ， 并 通过 全 局 的 消息 channel 来 将 这 些 文本 发 送出 去 ， 并 为 每 条 消息 带 上 发 送 者 的 前 缓 来 标 
明 消 息 身份 。 当 客户 端 发 送 完毕 后 ，handleConn 会 通过 leaving 这 个 channel 来 通知 客户 端的 
离开 并 关闭 连接 。 


func handleConn(conn net.Conn) { 
ch := make(chan string) // outgoing client messages 
go clientWriter(conn, ch) 


who := conn.RemoteAddr().String() 
ch <- "You are " + who 

messages <- who + " has arrived" 
entering <- ch 


input := bufio.NewScanner(conn) 
for input.Scan() { 
messages <- who + ": " + input.Text() 


} 


// NOTE: ignoring potential errors from input.Err() 


leaving <- ch 
messages <- who + " has left" 
conn.Close() 


func clientwriter(conn net.Conn, ch <-chan string) { 
for msg := range ch { 
fmt.Fprintin(conn, msg) // NOTE: ignoring network errors 


另外 ，handleConn 为 每 一 个 客户 端 创建 了 一 个 clientWriter 的 goroutine 来 接收 向 客户 端 发 出 消 
息 channel 中 发 送 的 广播 消息 ， 并 将 它们 写 入 到 客户 端的 网 络 连 接 。 客 户 端的 读 取 方 循环 会 在 
broadcaster 接 收 到 |leaving 通 知 并 关闭 了 channel 后 终止 。 


下 面 演示 的 是 当 服 务 器 有 两 个 活动 的 客户 端 连接 ， 并 且 在 两 个 窗口 中 运行 的 情况 ， 使 用 netcat 
来 聊天 : 


$ go build gopl.io/ch8/chat 
$ go build gopl.io/ch8/netcat3 


$ ./chat & 

$ ./netcat3 

You are 127.0.0.1:64208 $ ./netcat3 
127.0.0.1:64211 has arrived You are 127.0.0.1:64211 
Hi! 


127.0.0.1:64208: Hi! 
127.0.0.1:64208: Hi! 
Hi yourself. 


127.0.0.1:64211: Hi yourself. 127.0.0.1:64211: Hi yourself. 
AC 
127.0.0.1:64208 has left 
$ ./netcat3 
You are 127.0.0.1:64216 127.0.0.1:64216 has arrived 
Welcome. 
127.0.0.1:64211: Welcome. 127.0.0.1:64211: Welcome. 
AC 


127.0.0.1:64211 has left” 


当 与 n 个 客户 端 保持 聊天 Session 时 ， 这 个 程序 会 有 2n+2 个 并 发 的 goroutine， 然 而 这 个 程序 却 
并 不 需要 显 式 的 锁 (§9.2)。 ees x map tk RAAE J — 4% ZA goroutine P > broadcaster > 
所 以 它 不 能 被 并 发 地 访问 。 多 个 goroutine 共 享 的 变量 只 有 这 些 channel 和 net.Conn 的 实例 ， 两 
个 东西 都 是 并 发 安全 的 。 Vee eee a 并 发 安全 以 及 goroutine 中 共享 
变量 的 含义 。 


练习 8.12: 使 broadcaster 能 够 将 arrival 事 件 通知 当前 所 有 的 客户 端 。 为 了 达成 这 个 目的 ， 你 
需要 有 一 个 客户 端的 集合 ， 并 且 在 entering 和 leaving 的 channel 中 记录 客户 端的 名 字 。 


练习 8.13 : 使 聊天 服务 器 能 够 断 开 空闲 的 客户 端 连接 ， 比 如 最 近 五 分 钟 之 后 没有 发 送 任何 消 
息 的 那些 客户 端 ? 提示 : 可 以 在 其 它 goroutine 中 调用 conn.Close() 来 解除 Read 调 用 ， 就 像 
input.Scanner() 所 做 的 那样 。 


练习 8.14 : 修改 聊天 服务 器 的 网 络 协议 这 样 每 一 个 客户 端 就 可 以 在 entering 时 可 以 提供 它们 
的 名 字 。 将 消息 前 级 由 之 前 的 网 络 地 址 改 为 这 个 名 字 。 


练习 815: 如 果 一 个 客户 端 没 有 及 时 地 读 取 数据 可 能 会 导致 所 有 的 客户 端 被 阻塞 。 修 改 
broadcaster 来 跳 过 一 条 消息 ， 而 不 是 等 待 这 个 客户 端 一 直到 其 准备 好 写 。 或 者 为 每 一 个 客户 
端的 消息 发 出 channel 建 立 缓冲 区 ， 这 样 大 部 分 的 消息 便 不 会 被 丢掉 ; broadcaster 应 该 用 一 个 
非 阻塞 的 send 向 这 个 channel 中 发 消息 


第 九 章 基于 共享 变量 的 并 发 


前 一 章 我 们 介绍 了 一 些 使 用 goroutine 和 channel 这 样 直接 而 自然 的 方式 来 实现 并 发 的 方法 。 然 
而 这 样 做 我 们 实际 上 屏蔽 掉 了 在 写 并 发 代码 时 必须 处 理 的 一 些 重要 而 且 细微 的 问题 。 

在 本 章 中 ， 我 们 会 细致 地 了 解 并 发 机 制 。 尤 其 是 在 多 goroutine 之 间 的 共享 变量 ， 并 发 问题 的 
分 析 手 段 ， 以 及 解决 这 些 问题 的 基本 模式 。 最 后 我 们 会 解释 goroutine 和 操作 系统 线程 之 间 的 


技术 上 的 一 些 区 别 。 


9.1. BPAY 


在 一 个 线性 (就 是 说 只 有 一 个 goroutine 的 ) 的 程序 中 ， 程 序 的 执行 顺序 只 由 程序 的 逻辑 来 决定 。 
例如 ， 我 们 有 一 段 语句 序列 ， 第 一 个 在 第 二 个 之 前 (废话 )， 以 此 类 推 。 在 有 两 个 或 更 多 
goroutine 的 程序 中 ， 每 一 个 goroutine 内 的 语句 也 是 按照 既定 的 顺序 去 执行 的 ， 但 是 一 般 情 况 
下 我 们 没 法 去 知道 分 别 位 于 两 个 goroutine 的 事件 x 和 y 的 执行 顺序 ，x 是 在 y 之 前 还 是 之 后 还 是 
同时 发 生 是 没 法 判断 的 。 当 我 们 能 够 没有 办 法 自信 地 确认 一 个 事件 是 在 另 一 个 事件 的 前 面 或 
者 后 面 发 生 的 话 ， 就 说 明 x 和 y 这 两 个 事件 是 并 发 的 。 


考虑 一 下 ， 一 个 函数 在 线性 程序 中 可 以 正确 地 工作 。 如 果 在 并 发 的 情况 下 ， 这 个 函数 依然 可 
以 正确 地 工作 的 话 ， 那 么 我 们 就 说 这 个 函数 是 并 发 安全 的 ， 并 发 安全 的 函数 不 需要 额外 的 同 
步 工作 。 我 们 可 以 把 这 个 概念 概括 为 一 个 特定 类 型 的 一 些 方法 和 操作 函数 ， 如 果 这 个 类 型 是 
并 发 安全 的 话 ， 那 么 所 有 它 的 访问 方法 和 操作 就 都 是 并 发 安全 的 。 


在 一 个 程序 中 有 非 并 发 安全 的 类 型 的 情况 下 ， 我 们 依然 可 以 使 这 个 程序 并 发 安全 。 确 实 ， 并 
发 安全 的 类 型 是 例外 ， 而 不 是 规则 ， 所 以 只 有 当 文档 中 明确 地 说 明了 其 是 并 发 安全 的 情况 
下 ， 你 才 可 以 并 发 地 去 访问 它 。 我 们 会 避免 并 发 访问 大 多 数 的 类 型 ， 无 论 是 将 变量 局 限 在 单 
一 的 一 个 goroutine 内 还 是 用 互 斥 条 件 维持 更 高 级 别 的 不 变性 都 是 为 了 这 个 目的 。 我 们 会 在 本 
章 中 说 明 这 些 术 语 。 


相反 ， 导 出 包 级 别 的 函数 一 般 情 况 下 都 是 并 发 安全 的 。 由 于 package 级 的 变量 没 法 被 限制 在 单 
一 的 gorouine， 所 以 修改 这 些 变 量 “ 必 须 ” 使 用 互 斥 条 件 。 


一 个 函数 在 并 发 调用 时 没 法 工作 的 原因 太 多 了 ， 上 比如 死 锁 (deadlock)、 活 锁 (livelock) 和 人 包 Q 死 
(resource starvation)。 我 们 没有 空 去 讨论 所 有 的 问题 ， 这 里 我 们 只 聚焦 在 竞争 条 件 上 。 


竞争 条 件 指 的 是 程序 在 多 个 goroutine 交 又 执行 操作 时 ， 没 有 给 出 正确 的 结果 。 竞 争 条 件 是 很 
恶劣 的 一 种 场景 ， 因 为 这 种 问题 会 一 直 潜 伏 在 你 的 程序 里 ， 然 后 在 非常 少见 的 时 候 蹦 出 来 ， 
或 许 只 是 会 在 很 大 的 负载 时 才 会 发 生 ， 又 或 许 是 会 在 使 用 了 某 一 个 编译 器 、 某 一 种 平台 或 者 
某 一 种 架构 的 时 候 才 会 出 现 。 这 些 使 得 竞争 条 件 带 来 的 问题 非常 难以 复 现 而 且 难 以 分 析 诊 
BT o 


传统 上 经 常用 经 济 损失 来 为 竞争 条 件 做 比喻 ， 所 以 我 们 来 看 一 个 简单 的 银行 账户 程序 。 


// Package bank implements a bank with only one account. 
package bank 

var balance int 

func Deposit(amount int) { balance = balance + amount } 
func Balance() int { return balance } 


(当然 我 们 也 可 以 把 Deposit 存 款 函 数 写 成 balance += amount， 这 种 形式 也 是 等 价 的 ， 不 过 长 
一 些 的 形式 解释 起 来 更 方便 一 些 。) 


对 于 这 个 具体 的 程序 而 言 ， 我 们 可 以 上 县 一 眼 各 种 存款 和 查 余 额 的 顺序 调用 ， 都 能 给 出 正确 的 
结果 。 也 就 是 说 ，Balance 函 数 会 给 出 之 前 的 所 有 存 入 的 额度 之 和 。 然 而 ， 当 我 们 并 发 地 而 不 
是 顺序 地 调用 这 些 函 数 的 话 ，Balance 就 再 也 没 办 法 保证 结果 正确 了 。 考 虑 一 下 下 面 的 两 个 
goroutine， 其 代表 了 一 个 银行 联合 账户 的 两 笔 交 易 : 


// Alice: 
go func() { 
bank.Deposit (200) // A1 
fmt.Printin("=", bank.Balance()) // A2 
}() 


// Bob: 


go bank.Deposit(100) // B 


Alice 存 了 $200， 然 后 检查 她 的 余额 ， 同 时 Bob 存 了 $100。 因 为 A1 和 A2 是 和 B 并 发 执行 的 ， 我 
们 没 法 预测 他 们 发 生 的 先后 顺序 。 直 观 地 来 看 的 话 ， 我 们 会 认为 其 执行 顺序 只 有 三 种 可 能 

性 : “Alice 先 ”，“Bob 先 "以 及 “Alice/Bob/Alice” 交 错 执行 。 下 面 的 表格 会 展示 经 过 每 一 步骤 后 
balance 变 量 的 值 。 引 号 里 的 字符 串 表 示 余 额 单 。 


Alice first Bob first Alice/Bob/Alice 


0 0 0 

A1 200 B 100 A1 200 
A2 "=200" A1 300 B 300 
B 300 A2 "=300" A2 "=300" 


所 有 情况 下 最 终 的 余额 都 是 $300。 唯 一 的 变数 是 Alice 的 余额 单 是 否 包 含 了 Bob 交 易 ， 不 过 无 
论 怎 么 着 客户 都 不 会 在 意 。 


但 是 事实 是 上 面 的 直觉 推断 是 错误 的 。 第 四 种 可 能 的 结果 是 事实 存在 的 ， 这 种 情况 下 Bob 的 存 
款 会 在 Alice 存 款 操 作 中 间 ， 在 余额 被 读 到 (balance + amount) 之 后 ， 在 余额 被 更 新 之 前 
(balance = ...)， 这 样 会 导致 Bob 的 交易 丢失 。 而 这 是 因为 Alice 的 存款 操作 A1 实 际 上 是 两 个 操 
作 的 一 个 序列 ， 读 取 然 后 写 ; 可 以 称 之 为 A1r 和 A1w。 下 面 是 交 又 时 产生 的 问题 : 


Data race 

0 

Air 0 ... = balance + amount 
B 100 

A1w 200 balance = ... 

A2 "= 200" 


在 A1r 之 后 ，balance + amount 会 被 计算 为 200， 所 以 这 是 AT1W 会 写 入 的 值 ， 并 不 受 其 它 存款 
操作 的 干预 。 最 终 的 余额 是 $200。 银 行 的 账户 上 的 资产 比 Bob 实 际 的 资产 多 了 $100。 (译注 : 
因为 丢失 了 Bob 的 存款 操作 ， 所 以 其 实 是 说 Bob 的 钱 丢 了 ) 


这 个 程序 包含 了 一 个 特定 的 竞争 条 件 ， 叫 作 数据 竞争 。 无 论 任何 时 候 ， 只 要 有 两 个 goroutine 
并 发 访问 同一 变量 ， 且 至 少 其 中 的 一 个 是 写 操作 的 时 候 就 会 发 生 数据 竞争 。 


如 果 数 据 竞 争 的 对 象 是 一 个 比 一 个 机 器 字 ( 译 注 : 32 位 机 器 上 一 个 字 =4 个 字 节 ) 更 大 的 类 型 时 ， 
事情 就 变 得 更 麻烦 了 ， 比 如 interface，string 或 者 slice 类 型 都 是 如 此 。 下 面 的 代码 会 并 发 地 更 
新 两 个 不 同 长 度 的 slice : 


var x []int 

go func() { x = make([]Jint, 10) }() 

= make([]int, 1000000) }() 

// NOTE: undefined behavior; memory corruption possible! 


go func() 
x[999999] 


Hors 
e x 


最 后 一 个 语句 中 的 X 的 值 是 未 定义 的 ; 其 可 能 是 nil， 或 者 也 可 能 是 一 个 长 度 为 10 的 slice， 也 可 
能 是 一 个 程度 为 1,000,000 的 slice。 ie ee : 指针 (pointer)、 长 度 
(length) 和 容量 (capacity)。 如 果 指 针 是 从 第 一 个 make 调 用 来 ， 而 长 度 从 第 二 个 make 来 ，x 就 
变 成 了 一 个 混合 体 ， 一 个 自称 长 度 为 1,000,000 但 实际 上 内 部 只 有 10 个 元 素 的 slice。 这 样 导 致 
的 结果 是 存储 999,999 元 素 的 位 置 会 碰撞 一 个 遂 远 的 内 存 位 置 ， 这 种 情况 下 难以 对 值 进行 预 
测 ， 而 且 定 位 和 debug 也 会 变 成 恒 梦 。 这 种 语义 雷 区 被 称 为 未 定义 行为 ， 对 C 程 序 员 来 说 应 该 
很 熟悉 ; 幸运 的 是 在 Go 语言 里 造成 的 麻烦 要 比 C 里 小 得 多 。 


尽管 并 发 程序 的 概念 让 我 们 知道 并 发 并 不 是 简单 的 语句 交 又 执行 。 我 们 将 会 在 9.4 节 中 看 到 ， 
数据 竞争 可 能 会 有 奇怪 的 纪 a i ada “提出 一 些 
理由 来 允许 数据 竞争 ， 比 如 :“ 互 斥 条 件 代价 太 高 ，“ 这 个 逻辑 只 是 用 来 做 logging”"，“ 我 不 介意 
丢失 一 些 消息 "等 等 。 因 为 在 他 们 的 编译 器 或 者 平台 上 很 少 遇 到 问题 ， 可 能 给 了 他 们 错误 的 信 
心 。 一 个 好 的 经 验 法 则 是 根本 就 没有 什么 所 谓 的 良性 数据 竞争 。 所 以 我 们 一 定 要 避免 数据 竞 
争 ， 那 么 在 我 们 的 程序 中 要 如 何 做 到 呢 ? 


我 们 来 重复 一 下 数据 竞争 的 定义 ， 因 为 实在 太 重 要 了 : 数据 竞争 会 在 两 个 以 上 的 goroutine 并 
发 访问 相同 的 变量 且 至 少 其 中 一 个 为 写 操作 时 发 生 。 根 据 上 述 定 义 ， 有 三 种 方式 可 以 避免 数 
据 竞 争 : 

第 一 种 方法 是 不 要 去 写 变量 。 考 虑 一 下 下 面 的 map， 会 被 " 籁 "填充 ， 也 就 是 说 在 每 个 key 被 第 
一 次 请 求 到 的 时 候 才 会 去 雯 值 。 如 果 Icon 是 被 顺序 调用 的 话 ， 这 个 程序 会 工作 很 正常 ， 但 如 果 
Icon 被 并 发 调用 ， 那 么 对 于 这 个 map 来 说 就 会 存在 数据 竞争 。 


var icons = make(map[string]image. Image) 
func loadIcon(name string) image.Image 


// NOTE: not concurrency-safe! 
func Icon(name string) image.Image { 
icon, ok := icons[name] 
if !ok { 
icon = loadIcon(name) 
icons[name] = icon 


} 


return icon 


反之 ， 如 果 我 们 在 创建 goroutine 之 前 的 初始 化 阶段 ， 就 初始 化 了 map 中 的 所 有 条 目 并 且 再 也 
不 去 修改 它们 ， 那 么 任意 数量 的 goroutine 并 发 访问 lcon 都 是 安全 的 ， 因 为 每 一 个 goroutine 都 
只 是 去 读 取 而 已 。 


var icons = map[string]image.Image{ 
"spades.png": loadIcon("spades.png"), 
"hearts.png": loadIcon("hearts.png"), 
"diamonds.png": loadIcon("diamonds.png"), 
"clubs.png": loadIcon("clubs.png"), 

} 


// Concurrency-safe. 


func Icon(name string) image.Image { return icons[name] } 


上 面 的 例子 里 icons 变 量 在 包 初 始 化 阶段 就 已 经 被 赋值 了 ， 包 的 初始 化 是 在 程序 main 有 函数 开始 
执行 之 前 就 完成 了 的 。 只 要 初始 化 完成 了 ，icons 就 再 也 不 会 修改 的 或 者 不 变量 是 本 来 就 并 发 
安全 的 ， 这 种 变量 不 需要 进行 同步 。 不 过 显然 我 们 没 法 用 这 种 方法 ， 因 为 update 操作 是 必要 
的 操作 ， 尤 其 对 于 银行 账户 来 说 。 


第 二 种 避免 数据 竞争 的 方法 是 ， 避 免 从 多 个 goroutine 访 问 变量 。 这 也 是 前 一 章 中 大 多 数 程 序 
所 采用 的 方法 。 例 如 前 面 的 并 发 Web 人 怜 虫 ($8.6) 的 main goroutine 是 唯一 一 个 能 够 访问 seen 
map 的 goroutine， 而 聊天 服务 器 (§8.10) 中 的 broadcaster goroutine 是 唯一 一 个 能 够 访问 clients 
map 的 goroutine。 这 些 变量 都 被 限定 在 了 一 个 单独 的 goroutine 中 。 

由 于 其 它 的 goroutine 不 能 够 直接 访问 变量 ， 它 们 只 能 使 用 一 个 channel 来 发 送 给 指定 的 
goroutine 请 求 来 查询 更 新 变量 。 这 也 就 是 Go 的 口头 禅 “ 不 要 使 用 共享 数据 来 通信 ; 使 用 通信 来 
共享 数据 "。 一 个 提供 对 一 个 指定 的 变量 通过 cahnnel 来 请 求 的 goroutine 叫 做 这 个 变量 的 监控 
(monitor)goroutine。 例 如 broadcaster goroutine 会 监控 (monitor)clients map 的 全 部 访问 。 


下 面 是 一 个 重 写 了 的 银行 的 例子 ， 这 个 例子 中 balance 变 量 被 限制 在 了 monitor goroutine 中 ， 
名 为 teller : 


gopl.io/ch9/bank1 


// Package bank provides a concurrency-safe bank with one account. 
package bank 


var deposits = make(chan int) // send amount to deposit 


var balances make(chan int) // receive balance 


func Deposit(amount int) { deposits <- amount } 
func Balance() int { return <-balances } 


func teller() { 
var balance int // balance is confined to teller goroutine 
for { 
select { 
case amount := <-deposits: 
balance += amount 
case balances <- balance: 


} 


func init() { 
go teller() // start the monitor goroutine 


即使 当 一 个 变量 无 法 在 其 整个 生命 周期 内 被 绑 定 到 一 个 独立 的 goroutine， 绑 定 依然 是 并 发 问 
题 的 一 个 解决 方案 。 例 如 在 一 条 流水 线 上 的 goroutine 之 间 共 享 变量 是 很 普遍 的 行为 ， 在 这 两 
者 问 会 通过 channel 来 传输 地 址 信息 。 如 果 流 水 线 的 每 一 个 阶段 都 能 够 避免 在 将 变量 传送 到 下 
一 阶段 时 再 去 访问 它 ， 那 么 对 这 个 变量 的 所 有 访问 就 是 线性 的 。 其 效果 是 变量 会 被 绑 定 到 流 
水 线 的 一 个 阶段 ， 传 送 完 之 后 被 绑 定 到 下 一 个 ， 以 此 类 推 。 这 种 规则 有 时 被 称 为 串 行 绑 定 。 


下 面 的 例子 中 ，Cakes 会 被 严格 地 顺序 访问 ， 先 是 baker gorouine， 然 后 是 icer gorouine : 
type Cake struct{ state string } 


func baker(cooked chan<- *Cake) { 


for { 
cake := new(Cake) 
cake.state = "cooked" 


cooked <- cake // baker never touches this cake again 


} 
} 
func icer(iced chan<- *Cake, cooked <-chan *Cake) { 
for cake := range cooked { 
cake.state = "iced" 


iced <- cake // icer never touches this cake again 


第 三 种 避免 数据 竞争 的 方法 是 允许 很 多 goroutine 去 访问 变量 ， 但 是 在 同一 个 时 刻 最 多 只 有 一 
个 goroutine 在 访问 。 这 种 方式 被 称 为 “ 互 矿 "”， 在 下 一 节 来 讨论 这 个 主题 。 


练习 9.1 : 给 gopl.io/ch9/bank1 程 序 A int) 取 款 函 数 。 其 返回 结果 应 
该 要 表明 事务 是 成 功 了 还 是 因为 没有 足够 资金 失败 了 。 这 条 消息 会 被 发 送 给 monitor 的 


goroutine， 且 消息 需要 包含 取款 的 额度 和 一 个 新 的 channel， 这 个 新 channel 会 被 monitor 


goroutine 来 把 boolean 结 果 发 回 给 Withdraw ° 


9.2. sync.Mutex Z JF 4 


在 8.6 节 中 ， 我 们 使 用 了 一 个 buffered channel 作 为 一 个 计数 信号 量 ， 来 保证 最 多 只 有 20 个 
goroutine 会 同时 执行 HTTP 请 求 。 同 理 ， 我 们 可 以 用 一 个 容量 只 有 1 的 channel 来 保证 最 多 只 
一 个 goroutine 在 同一 时 刻 访问 一 个 共享 变量 。 一 个 只 能 为 1 和 0 的 信号 量 叫做 二 元 信和 号 量 


(binary semaphore) ° 


gopl.io/ch9/bank2 


var ( 
sema = make(chan struct{}, 1) // a binary semaphore guarding balance 
balance int 


) 


func Deposit(amount int) { 
sema <- struct{}{} // acquire token 
balance = balance + amount 
<-sema // release token 


} 


func Balance() int { 
sema <- struct{}{} // acquire token 


b := balance 
<-sema // release token 
return b 


这 种 互 斥 很 实用 ， 而 且 被 sync 包 里 的 Mutex 类 型 直接 支持 。 它 的 Lock 方 法 能 够 获取 到 token( 这 
里 叫 锁 )， 并 且 Unlock 方 法 会 释放 这 个 token : 


gopl.io/ch9/bank3 


import "sync" 


var ( 
mu sync.Mutex // guards balance 
balance int 


) 


func Deposit(amount int) { 
mu.Lock() 
balance = balance + amount 
mu.Unlock() 


} 

func Balance() int { 
mu.Lock() 
b := balance 
mu.Unlock() 
return b 


每 次 一 个 goroutine 访 问 bank 变 量 时 (这 里 只 有 balance 余 额 变量 )， 它 都 会 调用 mutex 的 Lock 方 
法 来 获取 一 个 互 斥 锁 。 如 果 其 它 的 goroutine 已 经 获得 了 这 个 锁 的 话 ， 这 个 操作 会 被 阻塞 直到 
其 它 goroutine 调 用 了 Unlock 使 该 锁 变 回 可 用 状态 。mutex 会 保护 共享 变量 。 惯 例 来 说 ， 被 
mutex 所 保护 的 变量 是 在 mutex 变 量 声明 之 后 立刻 声明 的 。 如 果 你 的 做 法 和 惯例 不 符 ， 确 保 在 
文档 里 对 你 的 做 法 进行 说 明 。 


在 Lock 和 Unlock 之 间 的 代码 段 中 的 内 容 goroutine 可 以 随便 读 取 或 者 修改 ， 这 个 代码 段 叫 做 临 
界 区 。goroutine 在 结束 后 释放 锁 是 必要 的 ， 无 论 以 哪 条 路 径 通 过 函数 都 需要 释放 ， 即 使 是 在 
关 误 路 径 中 ， 也 要 记得 释放 。 


上 面 的 bank 程 序 例证 了 一 种 通用 的 并 发 模式 。 一 系列 的 叶 出 函数 封装 了 一 个 或 多 个 变量 ， 那 
么 访问 这 些 变量 唯一 的 方式 就 是 通过 这 些 函 数 来 做 (或 者 方法 ， 对 于 一 个 对 象 的 变量 来 说 )。 每 
一 个 函数 在 一 开始 就 获取 互 斥 锁 并 在 最 后 释放 锁 ， 从 而 保证 共享 变量 不 会 被 并 发 访问 。 这 种 
函数 、 互 斥 锁 和 变量 的 编排 叫 作 监 控 monitor( 这 种 老式 单词 的 monitor 是 受 "monitor 
goroutine" 的 术语 启发 而 来 的 。 两 种 用 法 都 是 一 个 代理 人 保证 变量 被 顺序 访问 )。 


由 于 在 存款 和 查询 余额 函数 中 的 临界 区 代码 这 么 短 -- 只 有 一 行 ， 没 有 分 支 调 用 -- 在 代码 最 后 去 
调用 Unlock 就 显得 更 为 直截了当 。 在 更 复杂 的 临界 区 的 应 用 中 ， 尤 其 是 必须 要 尽早 处 理 错误 
并 返回 的 情况 下 ， 就 很 难 去 ( 靠 人 ) 判 断 对 Lock 和 Unlock 的 调用 是 在 所 有 路 径 中 都 能 够 严格 配对 
的 了 。Go 语 言 里 的 defer 简 直 就 是 这 种 情况 下 的 救星 : 我 们 用 defer 来 调用 Unlock， 临 界 区 会 
隐 式 地 延伸 到 有 函数 作用 域 的 最 后 ， 这 样 我 们 就 从 “总 要 记得 在 函数 返回 之 后 或 者 发 生 错 误 返 回 
时 要 记得 调用 一 次 Unlock" 这 种 状态 中 获得 了 解放 。Go 会 自动 帮 我 们 完成 这 些 事情 。 


func Balance() int { 
mu.Lock() 
defer mu.Unlock() 
return balance 


tmi = # Unlock # returns 47 1% IR Kbalance #4 tA ZS htr > PT VABalance AAEH RS 
全 的 。 这 带 来 的 另 一 点 好 处 是 ， 我 们 再 也 不 需要 一 个 本 地 变量 bp 了。 


， AAS 0 然 会 执行 ， a recover (§5. = 


ee Eames a Se a ee 
度 的 优化 更 重要 。 如 果 可 能 的 话 尽 量 使 用 defer 来 将 临界 区 扩展 到 部 数 的 结 


考虑 一 下 下 面 的 Withdraw 郊 数 。 成 功 的 时 候 ， 它 会 正确 地 减 掉 余额 并 返回 true。 但 如 果 银 行 记 
录 资 金 对 交易 来 说 不 足 ， 那 么 取款 就 会 恢复 余额 ， 并 返回 false 。 


// NOTE: not atomic! 
func Withdraw(amount int) bool { 
Deposit (-amount) 
if Balance() < 0 { 
Deposit (amount ) 
return false // insufficient funds 


} 


return true 


EO ee an ee en ee 多 的 取款 操作 同时 执行 时 ， 
balance 可 能 会 瞬时 被 减 到 0 以 下 。 这 可 能 会 引起 一 个 并 发 的 取款 被 不 合 逻 辑 地 拒绝 。 所 以 如 
果 Bob 党 os car 时 ，Alice 可 能 就 没 办 法 为 她 的 早 咖 啡 付款 了 。 这 里 的 问题 是 取款 

不 是 一 个 原子 操作 : 它 包 含 了 三 个 步骤 ， 每 一 步 都 需要 去 获取 并 释放 互 斥 锁 ， 但 任何 一 次 鳃 
都 不 会 锁 上 整个 取款 流程 。 


理想 情况 下 ， 取 款 应 该 只 在 整个 操作 中 获得 一 次 互 斥 锁 。 下 面 这 样 的 尝试 是 错误 的 : 


// NOTE: incorrect! 
func Withdraw(amount int) bool { 
mu.Lock() 


defer mu.Unlock() 
Deposit (-amount) 
if Balance() < 0 { 
Deposit (amount ) 
return false // insufficient funds 
} 


return true 


上 面 这 个 例子 中 ，Deposit 会 调用 mu.Lock() 第 二 次 去 获取 互 斥 锁 ， 但 因为 mutex 已 经 锁 上 了 ， 
而 无 法 被 重 入 (译注 : go 里 没有 重 入 锁 ， 关 于 重 入 锁 的 概念 ， 请 参考 java)-- 也 就 是 说 没 法 对 一 
个 已 经 锁 上 的 mutex 来 再 次 上 锁 -- 这 会 导致 程序 死 锁 ， 没 法 继续 执行 下 去 ，Withdraw 会 永远 阻 
塞 下 去 。 


关于 Go 的 互 斥 量 不 能 重 入 这 一 点 我 们 有 很 充分 的 理由 。 互 斥 量 的 目的 是 为 了 确保 共享 变量 在 
程序 执行 时 的 关键 点 上 能 够 保证 不 变性 。 不 变性 的 其 中 之 一 是 “没有 goroutine 访 问 共享 变量 ”。 
但 实际 上 对 于 mutex 保 护 的 变量 来 说 ， 不 变性 还 包括 其 它 方面 。 当 一 个 goroutine 获 得 了 一 个 互 
斥 锁 时 ， 它 会 断定 这 种 不 变性 能 够 被 保持 。 其 获取 并 保持 锁 期 间 ， 可 能 会 去 更 新 共享 变量 ， 
这 样 不 变性 只 是 短暂 地 被 破坏 。 然 而 当 其 释放 锁 之 后 ， 它 必须 保证 不 变性 已 经 恢复 原样 。 尽 
管 一 个 可 以 重 入 的 mutex 也 可 以 保证 没有 其 它 的 goroutine 在 访问 共享 变量 ， 但 这 种 方式 没 法 保 
证 这 些 变量 额外 的 不 变性 。( 译 注 : REGED AS) 


一 个 通用 的 解决 方案 是 将 一 个 函数 分 离 为 多 个 函数 ， 比 如 我 们 把 Deposit 分 离 成 两 个 : 一 个 不 
导出 的 函数 deposit， 这 个 函数 假设 锁 总 是 会 被 保持 并 去 做 实际 的 操作 ， 另 一 个 是 导出 的 函数 
Deposit， 这 个 元 数 会 调用 deposit， 但 在 调用 前 会 先 去 获取 锁 。 同 理 我 们 可 以 将 Withdraw 也 表 
示 成 这 种 形式 : 


func Withdraw(amount int) bool { 
mu.Lock() 
defer mu.Unlock() 
deposit (-amount) 
if balance < 0 { 
deposit (amount ) 
return false // insufficient funds 
} 


return true 


} 


func Deposit(amount int) { 
mu.Lock() 
defer mu.Unlock() 
deposit(amount) 


} 


func Balance() int { 
mu.Lock() 
defer mu.Unlock() 
return balance 


} 


// This function requires that the lock be held. 
func deposit(amount int) { balance += amount } 


当然 ， 这 里 的 存款 deposit 骂 数 很 小 实际 上 取款 Withdraw 元 数 不 需 要 理会 对 它 的 调用 ， 尽 管 如 
此 ， 这 里 的 表达 还 是 表明 了 规则 。 


封装 (S6.6), 用 限制 一 个 程序 中 的 意外 交互 的 方式 ， 可 以 使 我 们 获得 数据 结构 的 不 变性 。 因 为 
某 种 原因 ， 封 装 还 帮 我 们 获得 了 并 发 的 不 变性 。 当 你 使 用 mutex 时 ， 确 保 mutex 和 其 保护 的 变 
量 没有 被 导出 (在 go 里 也 就 是 小 写 ， 且 不 要 被 大 写字 母 开头 的 函数 访问 啦 )， 无 论 这 些 变量 是 包 
级 的 变量 还 是 一 个 struct 的 字段 。 


9.3. sync.RWMutex 读 写 锁 


在 100 刀 的 存款 消失 时 不 做 记录 多 少 还 是 会 让 我 们 有 一 些 恐 懂 ，Bob 写 了 一 个 程序 ， 每 秒 运行 
几 百 次 来 检查 他 的 银行 余额 。 他 会 在 家 ， 在 工作 中 ， 其 至 会 在 他 的 手机 上 来 运行 这 个 程序 。 
银行 注意 到 这 些 陡 增 的 流量 使 得 存款 和 取款 有 了 延 时 ， 因 为 所 有 的 余额 查询 请 求 是 顺序 执行 
的 ， 这 样 会 互 矿 地 获得 锁 ， 并 且 会 暂时 阻止 其 它 的 goroutine 运 行 。 


由 于 Balance 函 数 只 需要 读 取 变量 的 状态 ， 所 以 我 们 同时 让 多 个 Balance 调 用 并 发 运行 事实 上 
是 安全 的 ， 只 要 在 运行 的 时 候 没有 存款 或 者 取款 操作 就 行 。 在 这 种 场景 下 我 们 需要 一 种 特殊 
类 型 的 锁 ， 其 允许 多 个 只 读 操 作 并 行 执行 ， 但 写 操作 会 完全 互 矿 。 这 种 锁 叫 作 " 多 读 单 写 ? 俏 
(multiple readers, single writer lock)，Go 语 言 提供 的 这 样 的 锁 是 sync.RWMutex : 


var mu sync.RWMutex 

var balance int 

func Balance() int { 
mu.RLock() // readers lock 
defer mu.RUnlock() 
return balance 


Balance $% AA T RLock## RUnlock > >k HRA Fe HEA — MERARA HH F4ii e Deposit & 
数 没 有 变化 ， 会 调用 mu.Lock 和 mu.Unlock 方 法 来 获取 和 释放 一 个 写 或 互 矿 锁 。 


在 这 次 修改 后 ，Bob 的 余额 查询 请 求 就 可 以 彼此 并 行 地 执行 并 且 会 很 快 地 完成 了 。 锁 在 更 多 的 
时 间 范 围 可 用 ， 并 且 存 款 请 求 也 能 够 及 时 地 被 响应 了 。 


RLock 只 能 在 临 顺 区 共享 变量 没有 任何 写 入 操作 时 可 用 。 一 般 来 说 ， 我 们 不 应 该 假设 逻辑 上 的 
只 读 函 数 /方法 也 不 会 去 更 新 某 一 些 变量 。 比 如 一 个 方法 功能 是 访问 一 个 变量 ， 但 它 也 有 可 能 
会 同时 去 给 一 个 内 部 的 计数 器 +1( 译 注 : 可 能 是 记录 这 个 方法 的 访问 次 数 啥 的 )， 或 者 去 更 新 缓 
存 -- 使 即时 的 调用 能 够 更 快 。 如 果 有 疑惑 的 话 ， 请 使 用 互 斥 锁 。 


RVWMutex 只 有 当 获 得 锁 的 大 部 分 goroutine 都 是 读 操 作 ， 而 锁 在 竞争 条 件 下 ， 也 就 是 说 ， 


goroutine 们 必须 等 待 才能 获取 到 锁 的 时 候 ，RWMutex 才 是 最 能 带 来 好 处 的 。RWMutex 需 要 更 
复杂 的 内 部 记录 ， 所 以 会 让 它 比 一 般 的 无 竞争 锁 的 mutex 慢 一 些 。 


9.4. 内 存 同 步 


你 可 能 比较 纠结 为 什么 Balance 方 法 需要 用 到 互 斥 条 件 ， 无 论 是 基于 channel 还 是 基于 互 斥 
量 。 毕 竟 和 存款 不 一 样 ， 它 只 由 一 个 简单 的 操作 组 成 ， 所 以 不 会 碰 到 其 它 goroutine 在 其 执 
行 "中 "执行 其 它 的 逻辑 的 ae 。 这 里 使 用 mutex 有 两 方面 考虑 。 第 一 Balance 不 会 在 其 它 操作 
比如 Withdraw“ 中 间 ? 执 行 。 第 二 (更 重要 ) 的 是 "同步 "不 仅仅 是 一 堆 goroutine 执 行 顺序 的 问题 ; 
pe eae 


在 现代 计算 机 中 可 能 会 有 一 堆 处 理 器 ， 每 一 个 都 会 有 其 本 地 缓存 (local cache) ° AT HB? a 
内 存 的 写 入 一 般 会 在 每 一 个 处 理 器 中 缓冲 ， 并 在 必要 时 一 起 flush 到 主 存 。 这 种 情况 下 这 些 数 

据 可 能 会 以 与 当初 goroutine 写 入 顺序 不 同 的 顺序 被 提交 到 主 存 。 像 channel 通 信 或 者 互 矿 量 操 
作 这 样 的 原 语 会 使 处 理 器 将 其 聚集 的 写 入 flush 并 commit， 这 样 goroutine 在 某 个 时 间 点 上 的 执 
行 结果 才能 被 其 它 处 理 器 上 运行 的 goroutine 得 到 。 


考虑 一 下 下 面 代 码 片 段 的 可 能 输出 : 


var x, y int 
go func() { 
xX =1// A1 
ip Miter itp nits (CoVarieny wei eae) nese AZ 
}() 
go func() { 
y= // B1 
Mites en (0 XG ee eee BZ 


}() 


因为 pe nN ， 并 且 访 问 共享 变量 时 也 没有 互 斥 ， 会 有 数据 竞争 ， 所 以 程序 
的 运行 结果 没 法 预测 的 话 也 请 不 要 惊讶 。 我 们 可 能 希望 它 能 够 打印 出 下 面 这 四 种 结果 中 的 一 
(oi E 


y:0 x:1 
X:0 y:1 
> Waal 
yil x:1 


第 四 行 可 以 被 解释 为 执行 顺序 A1,B1,A2,B2 或 者 B1,A1,A2,B2 的 执行 结果 。 然而 实际 的 运行 时 
还 是 有 些 情况 让 我 们 有 点 惊讶 : 


但 是 根据 所 使 用 的 编译 器 ，CPU， 或 者 其 它 很 多 影响 因子 ， 这 两 种 情况 也 是 有 可 能 发 生 的 。 
那么 这 两 种 情况 要 怎么 解释 呢 ? 


在 一 个 独立 的 goroutine 中 ， 每 一 个 语句 的 执行 顺序 是 可 以 被 保证 的 ; 也 就 是 说 goroutine 是 顺 
序 连 贯 的 。 但 是 在 不 使 用 channel 且 不 使 用 mutex 这 样 的 显 式 同步 操作 时 ， 我 们 就 没 法 保证 事 
件 在 不 同 的 goroutine 中 看 到 的 执行 顺序 是 一 致 的 了 。 尽 管 goroutine A 中 一 定 需 要 观察 到 X=1 执 
行 成 功 之 后 才 会 去 读 取 y， 但 它 没 法 确保 自己 观察 得 到 goroutine B 中 对 y 的 写 入 ， 所 以 A 还 可 能 
会 打印 出 y 的 一 个 旧版 的 值 。 


尽管 去 理解 并 发 的 一 种 尝试 是 去 将 其 运行 理解 为 不 同 goroutine 语 名 的 交错 执行 ， 但 看 看 上 面 
的 例子 ， 这 已 经 不 是 现代 的 编译 器 和 cpu 的 工作 方式 了 。 因 为 赋值 和 打印 指向 不 同 的 变量 ， 编 
译 器 可 能 会 断定 两 条 语句 的 顺序 不 会 影响 执行 结果 ， 并 且 会 交换 两 个 语句 的 执行 顺序 。 如 果 
两 个 goroutine 在 不 同 的 CPU 上 执行 ， 每 一 个 核心 有 自己 的 缓存 ， 这 样 一 个 goroutine 的 写 入 对 
于 其 它 goroutine 的 Print， 在 主 存 同步 之 前 就 是 不 可 见 的 了 。 


所 有 并 发 的 问题 都 可 以 用 一 致 的 、 简 单 的 既定 的 模式 来 规避 。 所 以 可 能 的 话 ， 将 变量 限定 在 
goroutine 内 部 ; 如 果 是 多 个 goroutine 都 需要 访问 的 变量 ， 使 用 互 斥 条 件 来 访问 。 


9.5. sync.Once 77 #4 1t 


如 果 初 始 化 成 本 比较 大 的 话 ， 那 么 将 初始 化 延迟 到 需要 的 时 候 再 去 做 就 是 一 个 比较 好 的 选 
择 。 如 果 在 程序 启动 的 时 候 就 去 做 这 类 的 初始 化 的 话 会 增加 程序 的 启动 时 间 并 且 因为 执行 的 
时 候 可 能 也 并 不 需要 这 些 变量 所 以 实际 上 有 一 些 浪费 。 证 我 们 在 本 章 早 一 些 时 候 看 到 的 icons 


a 号 


LE: 


var icons map[string]image.Image 


这 个 版 本 的 Icon 用 到 了 懒 初 始 化 (lazy initialization) ° 


func loadIcons() { 


icons = map[string]image. Image{ 


"spades.png": loadIcon("spades.png"), 
"hearts.png": loadIcon("hearts.png"), 
"diamonds.png": loadIcon("diamonds.png"), 
ECLUuDSIDng loadIcon("clubs.png"), 


} 


// NOTE: not concurrency-safe! 
func Icon(name string) image.Image { 
if icons == nil { 
loadiIcons() // one-time initialization 
} 


return icons[name] 


如 果 一 个 变量 只 被 一 个 单独 的 goroutine 所 访问 的 话 ， 我 们 可 以 使 用 上 面 的 这 种 模板 ， 但 这 种 
模板 在 Icon 被 并 发 调用 时 并 不 安全 。 就 像 前 面 银行 的 那个 Deposit( 存 款 ) 函 数 一 样 ，lcon 函 数 也 
是 由 多 个 步骤 组 成 的 : 首先 测试 icons 是 否 为 室 ， 然 后 load 这 些 icons， 之 后 将 icons 更 新 为 一 个 
非 空 的 值 。 直 觉 会 告诉 我 们 最 差 的 情况 是 loadlcons 函 数 被 多 次 访问 会 带 来 数据 竞争 。 当 第 一 
4goroutine # I= 4 loading è “icons #) 4% > 4 —~*goroutine#t à F Icon hk > RMS 
nil， 然 后 也 会 调用 loadlcons 函 数 。 


不 过 这 种 直觉 是 错误 的 。( 我 们 希望 现在 你 从 现在 开始 能 够 构建 自己 对 并 发 的 直觉 ， 也 就 是 说 
对 并 发 的 直觉 总 是 不 能 被 信任 的 1) 回忆 一 下 9.4 节 。 因 为 缺少 显 式 的 同步 ， 编 译 器 和 CPU 是 可 
以 随意 地 去 更 改 访问 内 存 的 指令 顺序 ， 以 任意 方式 ， 只 要 保证 每 一 个 goroutine 自 己 的 执行 顺 
序 一 致 。 其 中 一 种 可 能 loadlcons 的 语句 重 排 是 下 面 这 样 。 它 会 在 填写 icons 变 量 的 值 之 前 先 用 
一 个 室 map 来 初始 化 icons 变 量 。 


func loadIcons() { 
icons = make(map[string]image. Image) 
icons["spades.png"] = loadIcon("spades.png") 
icons["hearts.png"] = loadIcon("hearts.png") 
icons["diamonds.png"] = loadIcon("diamonds. png") 
icons["clubs.png"] = loadIcon("clubs.png") 


因此 ， 一 个 goroutine 在 检查 icons 是 非 空 时 ， 也 并 不 能 就 假设 这 个 变量 的 初始 化 流程 已 经 走 完 
了 (译注 : 可 能 只 是 塞 了 个 空 nap， 里 面 的 值 还 没 填 完 ， 也 就 是 说 填 值 的 语句 都 没 执行 完 呢 ) 。 


最 简单 且 正 确 的 保证 所 有 goroutine 能 够 观察 到 loadlcons 效 果 的 方式 ， 是 用 一 个 mutex 来 同步 


var mu sync.Mutex // guards icons 
var icons map[string]image. Image 


// Concurrency-safe. 
func Icon(name string) image.Image { 


mu.Lock() 
defer mu.Unlock() 
if icons == nil { 


loadIcons() 


} 


return icons[name] 


ee E 
完毕 且 再 也 不 会 进行 变动 。 这 里 我 们 可 以 引入 一 个 允许 多 读 的 锁 


var mu sync.RWMutex // guards icons 
var icons map[string]image.Image 
// Concurrency-safe. 


func Icon(name string) image.Image { 


mu.RLock() 
if icons != nil { 
icon := icons[name] 


mu.RUnlock( ) 
return icon 


mu.RUnlock( ) 


// acquire an exclusive lock 

mu.Lock() 

if icons == nil { // NOTE: must recheck for nil 
loadIcons() 

} 


icon := icons[name] 
mu.Unlock() 
return icon 


上 面 的 代码 有 两 个 临界 区 。goroutine 首 先 会 获取 一 个 写 锁 ， 查 询 map， 然 后 释放 锁 。 如 果 条 
目 被 找到 了 (一 般 情 况 下 )， 那 么 会 直接 返回 。 如 果 没 有 找到 ， 那 goroutine 会 获取 一 个 写 锁 。 不 
释放 共享 锁 的 话 ， 也 没有 任何 办 法 来 将 一 个 共享 锁 升 级 为 一 个 互 斥 锁 ， 所 以 我 们 必须 重新 检 
查 icons 变 量 是 否 为 nil， 以 防止 在 执行 这 一 段 代码 的 时 候 ，icons 变 量 已 经 被 其 它 gorouine 初 始 
化 过 了 。 


上 面 的 模板 使 我 们 的 程序 能 够 更 好 的 并 发 ， 但 是 有 一 点 太 复 杂 且 容易 出 错 。 幸 运 的 是 ，Ssync 
包 为 我 们 提供 了 一 个 专门 的 方案 来 解决 这 种 一 次 性 初始 化 的 问题 : sync.Once。 概 念 上 来 讲 ， 
一 次 性 的 初始 化 需要 一 个 互 乒 量 mutex 和 一 个 boolean 变 量 来 记录 初始 化 是 不 是 已 经 完成 了 5 
互 太 量 用 来 保护 boolean 变 量 和 客户 端 数据 结构 。Do 这 个 唯一 的 方法 需要 接收 初始 化 函数 作为 
其 参数 。 让 我 们 用 sync.Once 来 简化 前 面 的 Icon 函数 吧 : 


var loadIconsOnce sync.Once 

var icons map[string]image.Image 

// Concurrency-safe. 

func Icon(name string) image.Image { 
loadIconsOnce.Do(loadiIcons) 


return icons[name] 


每 一 次 对 Dolloadlcons) 的 调用 都 会 锁定 mutex， 并 会 检查 boolean 变 量 。 在 第 一 次 调用 时 ， 变 
量 的 值 是 false，Do 会 调用 loadlcons 并 会 将 boolean 设 置 为 ttue。 随 后 的 调用 什么 都 不 会 做 ， 
但 是 mutex 同 步 会 保证 loadlcons 对 内 存 (这 里 其 实 就 是 指 icons 变 量 啦 ) 产 生 的 效果 能 够 对 所 有 


goroutine 可 见 。 用 这 种 方式 来 使 用 Sync.Once 的 话 ， 我 们 能 够 避免 在 变 

它 goroutine 共 享 该 变量 。 

练习 9.2 : 重 写 2.6.2 节 中 的 PopCount 的 例子 ， 使 用 sync.Once， 只 在 第 一 
进行 初始 化 。( 虽 然 实际 上 ， 对 PopCount 这 

x) 


rh 


量 被 构建 完成 之 前 和 其 


次 需要 用 到 的 时 候 


样 很 小 且 高 度 优化 的 函数 进行 同步 可 能 代价 没 法 接 


9.6. ZF AEM 


BRAS AAT PB] AREA De > HEH RAL PILE RABAT o $3449 > Gotruntimete 
工具 链 为 我 们 装备 了 一 个 复杂 但 好 用 的 动态 分 析 工 具 ， 竞 争 检查 器 (the race detector) 。 


只 要 在 go build > go run 或 者 go test 命 令 后 面 加 上 -race 的 flag， 就 会 使 编译 器 创建 一 个 你 的 应 
用 的 "修改 "版 或 者 一 个 附带 了 能 够 记录 所 有 运行 期 对 共享 变量 访问 工具 的 test， 并 且 会 记录 下 
每 一 个 读 或 者 写 共享 变量 的 goroutine 的 身份 信息 。 另 外 ， 修 改版 的 程序 会 记录 下 所 有 的 同步 
事件 ， gos 4) > channelłk4# > v2 Æ 3t(*sync.Mutex).Lock > (*sync.WaitGroup).Wait # 
的 调用 。( 完 整 的 同步 事件 集合 是 在 The Go Memory Model 文 档 中 有 说 明 ， 该 文档 是 和 语言 文 


档 放 在 一 起 的 。 译 注 : https://golang.org/ref/mem) 


竞争 检查 器 会 检查 这 些 事件 ， 会 寻找 在 哪 一 个 goroutine 中 出 现 了 这 样 的 case， 例 如 其 读 或 者 
ee 
的 。 这 种 情况 也 就 表明 了 是 对 一 个 共享 变量 的 并 发 访问 ， 即 数据 竞争 。 这 个 工具 会 打印 一 份 
报告 ， 内 容 包 含 变 量 身份 ， 读 取 和 写 入 的 goroutine 中 活跃 的 函数 的 调用 栈 。 这 些 信息 在 定位 
问题 时 通常 很 有 用 。9.7 节 中 会 有 一 个 竞争 检查 器 的 实战 样 例 。 


竞争 检查 器 会 报告 所 有 的 已 经 发 生 的 数据 竞争 。 然 而 ， 它 只 能 检测 到 运行 时 的 竞争 条 件 ; 并 
不 能 证 明之 后 不 会 发 生 数据 竞争 。 所 以 为 了 使 结果 尽量 正确 ， 请 保证 你 的 测试 并 发 地 才 盖 到 
了 
由 


于 需要 人 额外 的 记录 ， 因 此 构建 时 加 了 竞争 检测 的 程序 跑 起 来 会 慢 一 些 ， 且 需要 更 大 的 内 
存 ， 即 时 是 这 样 ， 这 些 代价 对 于 很 多 生产 环境 的 工作 来 说 还 是 可 以 接受 的 。 ba 

竞争 条 件 来 说 ， 让 竞争 检查 器 来 干 活 可 以 节省 无 数 日 夜 的 debugging。( 译 注 : 多 少 服务 端 C 和 
C+ 程序 员 为 此 尽 折腰 ) 


9.7. 示例 : 并 发 的 非 阻 塞 缓存 


ETTE EAE E E E TA E A eel ieee ce 
AEA RGE T VA fA R BY) A o A A y VE k G (memoizing) 4 4 (iF = : Memoization 的 
定义 : memoization —74] Æ Donald Michie 根据 拉丁 语 memorandum 杜 撰 的 一 个 词 。 相 应 的 
动词 、 过 去 分 词 、ing 形 式 有 memoiz、memoized、memoizing.)， 也 就 是 说 ， 我 们 需要 缓存 函 
数 的 返回 结果 ， 这 样 在 对 防 数 进行 调用 的 时 候 ， o 需要 一 次 计算 ， 之 后 只 要 返回 计算 
的 结果 就 可 以 了 。 我 们 的 解决 方案 会 是 并 发 安全 且 会 避免 对 整个 缓存 加 锁 而 导致 所 有 操作 都 
去 争 一 个 锁 的 设计 。 


我 们 将 使 用 下 面 的 httpGetBody 兄 数 作为 我 们 需要 缓存 的 函数 的 一 个 样 例 。 这 个 函数 会 去 进行 
HTTP GET 请 求 并 且 获 取 http 响 应 body。 对 这 个 函数 的 调用 本 身 开销 是 比较 大 的 ， 所 以 我 们 尽 
量 尽量 避 免 在 不 必要 的 时 候 反 复 调 用 。 


func httpGetBody(url string) (interface{}, error) { 
resp, err := http.Get(url) 
if err != nil { 
return nil, err 


} 
defer resp.Body.Close() 
return ioutil.ReadAll(resp.Body) 


pee md = Ee PRR a 告 果 ， 一 个 []byte 数 组 和 一 个 错误 ， 不 过 

这 两 个 对 象 可 以 被 赋值 给 httpGetBody 的 返回 声明 P 类 型 ， 所 以 我 们 也 就 
可 以 这 样 返回 结果 并 且 不 需要 额外 的 工作 了 。 我 们 在 httpGetBody 中 选用 这 种 返回 类 型 是 为 了 
使 其 可 以 与 缓存 匹配 。 


下 面 是 我 们 要 设计 的 cache 的 第 一 个 "草稿 ”: 


gopl.io/ch9/memo1 


// Package memo provides a concurrency-unsafe 
// memoization of a function of type Func. 
package memo 


// A Memo caches the results of calling a Func. 
type Memo struct { 

ify Func 

cache map[string]result 


// Func is the type of the function to memoize. 
type Func func(key string) (interface{}, error) 


type result struct { 
value interface{} 
err error 


func New(f Func) *Memo { 
return &Memo{f: f, cache: make(map[string]result)} 


// NOTE: not concurrency-safe! 
func (memo *Memo) Get(key string) (interface{}, error) { 
res, ok := memo.cache[key] 
if tok { 
res.value, res.err = memo.f(key) 
memo.cache[key] = res 


} 


return res.value, res.err 


Memo 实 例会 记录 需要 缓存 的 函数 f( 类 型 为 Func)， 以 及 缓存 内 容 ( 里 面 是 一 个 string 到 result 映 
射 的 map)。 每 一 个 result 都 是 都 是 简单 的 函数 返回 的 值 对 儿 -- 一 个 值 和 一 个 错误 值 。 继 续 下 去 
我 们 会 展示 一 些 Memo 的 变种 ， 不 过 所 有 的 例子 都 会 遵循 这 些 上 面 的 这 些 方面 。 


下 面 是 一 个 使 用 Memo 的 例子 。 对 于 流入 的 URL 的 每 一 个 元 素 我 们 都 会 调用 Get， 并 打印 调用 
延 时 以 及 其 返回 的 数据 大 小 的 log : 


m := memo.New(httpGetBody ) 
for url := range incomingURLs() { 
start := time.Now() 
value, err := m.Get(url) 
if err != nil { 
log.Print(err) 
} 
fmt.Printf("%s, %s, %d bytes\n", 
url, time.Since(start), len(value.([]byte))) 


我 们 可 以 使 用 测试 包 ( 第 11 章 的 主题 ) 来 系统 地 鉴定 缓存 的 效果 。 从 下 面 的 测试 输出 ， 我 们 可 以 
看 到 URL 流 包含 了 一 些 重复 的 情况 ， 尽 管 我 们 第 一 次 对 每 一 个 URL 的 (*Memo).Get 的 调用 都 会 
花 上 几 百 毫秒 ， 但 第 二 次 就 只 需要 花 1 毫 秒 就 可 以 返回 完整 的 数据 了 。 


$ go test -v gopl.io/ch9/memo1 

=== RUN Test 

https://golang.org, 175.026418ms, 7537 bytes 
https://godoc.org, 172.686825ms, 6878 bytes 
https://play.golang.org, 115.762377ms, 5767 bytes 
http://gopl.io, 749.887242ms, 2856 bytes 
https://golang.org, 721ns, 7537 bytes 
https://godoc.org, 152ns, 6878 bytes 
https://play.golang.org, 205ns, 5767 bytes 
http://gopl.io, 326ns, 2856 bytes 

--- PASS: Test (1.21s) 

PASS 

ok gopl.io/ch9/memo1 1.257s 


这 个 测试 是 顺序 地 去 做 所 有 的 调用 的 。 


由 于 这 种 彼此 独立 的 HTTP 请 求 可 以 很 好 地 并 发 ， 我 们 可 以 把 这 个 测试 改 成 并 发 形式 。 可 以 使 
用 sync.WaitGroup 来 等 待 所 有 的 请 求 都 完成 之 后 再 返回 


m := memo.New(httpGetBody ) 
var n sync.WaitGroup 


for url := range incomingURLs() { 
n.Add(1) 
go func(url string) { 
start := time.Now() 
value, err := m.Get(url) 
if err != nil { 


log.Print(err) 


} 
fmt.Printf("%s, %s, %d bytes\n", 


url, time.Since(start), len(value.([]byte))) 
n.Done() 


(url) 


} 
n.Wait() 


这 次 测试 跑 起 来 更 快 了 ， 然 而 不 幸 的 是 貌似 这 个 测试 不 是 每 次 都 能 够 正常 工作 。 我 们 注意 
有 一 些 意料 之 外 的 cache miss( 缓 存 未 命中 )， 或 者 命中 了 缓存 但 却 返回 了 错误 的 值 ， a 
会 直接 崩溃 。 

但 更 糟糕 的 是 ， 有 时 候 这 个 程序 还 是 能 正确 的 运行 ( 译 : 也 就 是 最 让 人 崩 江 的 偶发 bug)， 所 以 


我 们 其 至 可 能 都 不 会 意识 到 这 个 程序 有 bug。。 但 是 我 们 可 以 使 用 -race 这 个 flag 来 运行 程序 ， 
竞争 检测 器 (§9.6) 会 打印 像 下 面 这 样 的 报告 : 


$ go test -run=TestConcurrent -race -v gopl.io/ch9/memo1 
=== RUN TestConcurrent 


WARNING: DATA RACE 
Write by goroutine 36: 
runtime.mapassign1() 
~/go/src/runtime/hashmap.go:411 +0x0 
gopl.io/ch9/memo1. (*Memo) .Get() 
~/gobook2/src/gopl.io/ch9/memoi/memo.go:32 +0x205 


Previous write by goroutine 35: 
runtime.mapassign1() 
~/go/src/runtime/hashmap.go:411 +0x0 
gopl.io0/ch9/memo1. (*Memo) .Get( ) 
~/gobook2/src/gopl.io/ch9/memo1/memo.go:32 +0x205 


Found 1 data race(s) 
FAIL gopl.io/ch9/memo1 2.393s 


memo.go 的 32 行 出 现 了 两 次 ， 说 明 有 两 个 goroutine 在 没有 同步 干预 的 情况 下 更 新 了 cache 
map。 这 表明 Get 不 是 并 发 安全 的 ， 存 在 数据 竞争 。 


28 func (memo *Memo) Get(key string) (interface{}, error) { 


29 res, ok := memo.cache(key) 

30 if tok { 

ell res.value, res.err = memo.f(key) 
32 memo.cache[key] = res 

33 } 

34 return res.value, res.err 

35 } 


最 简单 的 使 cache 并 发 安全 的 方式 是 使 用 基于 监控 的 同步 。 只 要 给 Memo 加 上 一 个 mutex， 在 
Get 的 一 开始 获取 互 斥 锁 ，return 的 时 候 释放 锁 ， 就 可 以 让 cache 的 操作 发 生 在 临界 区 内 了 : 
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type Memo struct { 
f Func 
mu sync.Mutex // guards cache 
cache map[string]result 


// Get is concurrency-safe. 
func (memo *Memo) Get(key string) (value interface{}, err error) { 
res, ok := memo.cache[key] if!ok{ 
res.value, res.err = memo.f(key) 
memo.cache[key] = res 
memo.mu.Lock() 
res, ok := memo.cache[key] 
if tok { 
res.value, res.err = memo.f(key) 
memo.cache[key] = res 
} 
memo.mu.Unlock() 
return res.value, res.err 


测试 依然 并 发 进行 ， 但 这 回 竞争 检查 器 "沉默 "了 。 不 幸 的 是 对 于 Memo 的 这 一 点 改变 使 我 们 完 
全 责 失 了 并 发 的 性 能 优点 。 每 次 对 f 的 调用 期 间 都 会 持 有 锁 ，Get 将 本 来 可 以 并 行 运行 的 JO 操 
作 囊 行 化 了 。 我 们 本 章 的 目的 是 完成 一 个 无 锁 缓存 ， 而 不 是 现在 这 样 的 将 所 有 请 求 串 行 化 的 
函数 的 缓存 。 


下 一 个 Get 的 实现 ， 调 用 Get 的 goroutine 会 两 次 获取 锁 : 查找 阶段 获取 一 次 ， 如 果 查 找 没 有 返 
回 任何 内 容 ， 那 么 进入 更 新 阶段 会 再 次 获取 。 在 这 两 次 获取 锁 的 中 间 阶 段 ， 其 它 goroutine 可 
以 随意 使 用 cache 。 
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func (memo *Memo) Get(key string) (value interface{}, err error) { 
memo.mu.Lock() 
res, ok := memo.cache[key] 
memo.mu.Unlock() 
if tok { 
res.value, res.err = memo.f(key) 


// Between the two critical sections, several goroutines 
// may race to compute f(key) and update the map. 
memo.mu.Lock() 

memo.cache[key] = res 

memo.mu.Unlock() 


} 


return res.value, res.err 


这 些 修改 使 性 能 再 次 得 到 了 提升 ， 但 有 一 些 URL 被 获取 了 。 这 种 情况 在 两 个 以 上 的 
goroutine 同 一 时 刻 调用 Get 来 请 求 同 样 的 URL 时 会 发 生 。 多 个 goroutine 一 起 查询 cache， 发 现 
没有 值 ， 然 后 一 起 调用 f 这 个 慢 不 拉 员 的 函数 。 在 得 到 ee ， 也 都 会 去 去 更 新 map。 其 中 一 
个 获得 的 结果 会 覆盖 掉 另 一 个 的 结果 。 


理想 情况 下 是 应 该 避免 掉 多 余 的 工作 的 。 而 这 种 “避免 "工作 一 般 被 称 为 duplicate 
suppression( 重 复 抑 制 /避免 )。 下 面 版 本 的 Memo 每 一 个 map 元 素 都 是 指向 一 个 条 目的 指针 。 
每 一 个 条 目 包 含 对 函数 f 调 用 结果 的 内 容 缓存 。 Senne Any ESS: 了 一 个 叫 
ready 的 channel。 在 条 目的 结果 被 设置 之 后 ， 这 个 channel 就 会 被 关闭 ， 以 向 其 它 goroutine 广 
播 (§8.9) 去 读 取 该 条 目 内 的 结果 是 安全 的 了 。 
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type entry struct { 
res result 
ready chan struct{} // closed when res is ready 


func New(f Func) *Memo { 
return &Memo{f: f, cache: make(map[string]*entry)} 


} 
type Memo struct { 
f Func 
mu sync.Mutex // guards cache 


cache map[string]*entry 


func (memo *Memo) Get(key string) (value interface{}, err error) { 
memo.mu.Lock() 
e := memo.cache[key] 
if e == nil { 
// This is the first request for this key. 





// This goroutine becomes responsible for computing 
// the value and broadcasting the ready condition. 
e = &entry{ready: make(chan struct{})} 
memo.cache[key] = e 

memo.mu.Unlock() 


e.res.value, e.res.err = memo.f(key) 


close(e.ready) // broadcast ready condition 
y else { 

// This is a repeat request for this key. 

memo.mu.Unlock() 


<-e.ready // wait for ready condition 


} 


return e.res.value, e.res.err 


现在 Get 元 数 包括 下 面 这 些 步骤 了 : 获取 互 斥 锁 来 保护 共享 变量 cache map， 查 询 map 中 是 否 
存在 指定 条 目 ， 如 果 没 有 找到 那么 分 配 空间 插入 一 个 新 条 目 ， 释 放 互 斥 锁 。 如 果 存 在 条 目的 

话 且 其 值 没有 写 入 完成 (也 就 是 有 其 它 的 goroutine 在 调用 f 这 个 慢 函 数 ) 时 ，goroutine 必 须 等 待 
值 ready 之 后 才能 读 到 条 目的 结果 。 而 想 知 道 是 否 ready 的 话 ， 可 以 直接 从 ready channel 中 读 
取 ， 由 于 这 个 读 取 操 作 在 channel 关 闭 之 前 一 直 是 阻塞 。 


如 果 没 有 条 目的 话 ， 需 要 向 map 中 插入 一 个 没有 ready 的 条 目 ， 当 前 正在 调用 的 goroutine 就 需 
要 负责 调用 慢 函 数 、 更 新 条 目 以 及 向 其 它 所 有 goroutine 广 播 条 目 已 经 ready 可 读 的 消息 了 。 


条 目 中 的 e.res.value 和 e.res.err 变 量 是 在 多 个 goroutine 之 间 共 享 的 。 创 建 条 目的 goroutine 同 
时 也 会 设置 条 目的 值 ， 其 它 goroutine 在 收 到 "ready" 的 广播 消息 之 后 立刻 会 去 读 取 条 目的 值 。 
个 goroutine 同 时 访问 ， 但 却 并 不 需要 互 斥 锁 。ready channel 的 关闭 一 定 会 发 生 在 
它 goroutine 接 收 到 广播 事件 之 前 ， 因 此 第 一 个 goroutine 对 这 些 变 量 的 写 操作 是 一 定 发 生 在 
ws 的 。 不 会 发 生 数据 竞争 。 


这 样 并 发 、 不 重复 、 无 阻塞 的 cache 就 完成 了 。 


面 这样 Memo 的 实现 使 用 了 一 个 互 斥 量 来 保护 多 个 goroutine 调 用 Get 时 的 共享 map 变 量 。 不 
妨 把 这 种 设计 和 前 面 提 到 的 把 map 变 量 限 制 在 一 个 单独 的 monitor goroutine 的 方案 做 一 些 对 
比 ， 后 者 在 调用 Get 时 需要 发 消息 。 


Func、result 和 entry 的 声明 和 之 前 保持 一 致 : 


// Func is the type of the function to memoize. 
type Func func(key string) (interface{}, error) 


// A result is the result of calling a Func. 
type result struct { 

value interface{} 

err error 


} 


type entry struct { 
res result 
ready chan struct{} // closed when res is ready 


然而 Memo 类 型 现在 包含 了 一 个 叫做 requests 的 channel，Get 的 调用 方 用 这 eae 
monitor goroutine 来 通信 ° requests channel 中 的 元 素 类 型 是 request。Get 的 调用 方 会 把 这 

结构 中 的 两 组 key 都 填充 好 ， 实 际 上 用 这 两 个 变量 来 对 函数 进行 缓存 的 。 另 一 个 叫 cana 
channel 会 被 拿 来 发 送 响应 结果 。 这 个 channel 只 会 传 回 一 个 单独 的 值 。 
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// A request is a message requesting that the Func be applied to key. 
type request struct { 

key string 

response chan<- result // the client wants a single result 


type Memo struct{ requests chan request } 
// New returns a memoization of f. Clients must subsequently call Close. 
func New(f Func) *Memo { 

memo := &Memo{requests: make(chan request) } 

go memo.server(f) 

return memo 


func (memo *Memo) Get(key string) (interfacef{}, error) { 
response := make(chan result) 
memo.requests <- request{key, response} 
res := <-response 
return res.value, res.err 


func (memo *Memo) Close() { close(memo.requests) } 


上 面 的 Get 方 法 ， 会 创建 一 个 response channel， 把 它 放 进 request 结 构 中 ， 然 后 发 送 给 
monitor goroutine， 然 后 马上 又 会 接收 到 它 。 


cache 变 量 被 限制 在 了 monitor goroutine (*Memo).server 中 ， 下 面 会 看 到 。monitor 会 在 循环 
中 一 直 读 取 请 求 ， 直 到 request channel 被 Close 方 法 关闭 。 每 一 个 请 求 都 会 去 查询 cache， 如 
果 没 有 找到 条 目的 话 ， 那 么 就 会 创建 /插入 一 个 新 的 条 目 。 


func (memo *Memo) server(f Func) { 


cache := make(map[string]*entry) 
for req := range memo.requests { 
e := cache[req.key] 


if e == nil { 
// This is the first request for this key. 
e = &entry{ready: make(chan struct{})} 
cache[req.key] =e 
go e.call(f, req.key) // call f(key) 

} 


go e.deliver(req.response) 


} 


func (e *entry) call(f Func, key string) { 
// Evaluate the function. 
e.res.value, e.res.err = f(key) 
// Broadcast the ready condition. 
close(e.ready) 


} 


func (e *entry) deliver(response chan<- result) { 
// Wait for the ready condition. 
<-e. ready 
// Send the result to the client. 
response <- e.res 


和 基于 互 斥 量 的 版 本 类 似 ， 第 一 个 对 某 个 key 的 请 求 需要 负责 去 调用 函数 f 并 传 入 这 个 key， 将 
结果 存在 条 目 里 ， 并 关闭 ready channel 来 广播 条 目的 ready 消 息 。 使 用 (*entry).call 来 完成 上 述 
工作 。 


紧 接 着 对 同一 个 key 的 请 求 会 发 现 map 中 已 经 有 了 存在 的 条 目 ， 然 后 会 等 待 结 果 变 为 ready ， 
并 将 结果 从 response 发 送 给 客户 端的 goroutien。 上 述 工作 是 用 (* ht 完成 的 。 对 
call 和 deliver 方 法 的 调用 必须 在 自己 的 goroutine 中 进行 以 确保 monitor goroutines 不 会 因此 而 被 
阻塞 住 而 没 法 处 理 新 的 请 求 。 


这 个 例子 说 明 我 们 无 论 可 以 用 上 锁 ， 还 是 通信 来 建立 并 发 程序 都 是 可 行 的 。 


上 面 的 两 种 方案 并 不 好 说 特定 情境 下 哪 种 更 好 ， 不 过 了 解 他 们 还 是 有 价值 的 。 有 时 候 从 一 种 
方式 切换 到 另 一 种 可 以 使 你 的 代码 更 为 简洁 。( 译 注 : 不 是 说 好 的 golang 推 党 通信 并 发 么 ) 


练习 9.3 : 扩展 Func 类 型 和 (*Memo).Get 方 法 ， 支 持 调 用 方 提供 一 个 可 选 的 done channel， 使 
其 具备 通过 该 channel 来 取消 整个 操作 的 能 力 ($8.9)。 一 个 被 取消 了 的 Func 的 调用 结果 不 应 该 
被 缓存 。 
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9.8. Goroutines 和 线程 


在 上 一 章 中 我 们 说 goroutine 和 操作 系统 的 线程 区 别 可 以 先 忽 略 。 尽 管 两 者 的 区 别 实际 上 只 是 
一 个 量 的 区 别 ， 但 量变 会 引起 质变 的 道理 同样 适用 于 goroutine 和 线程 。 现 在 正 是 我 们 来 区 分 
开 两 者 的 最 佳 时 机 。 


9.8.1. 动态 栈 


每 一 个 OS 线 程 都 有 一 个 国定 大 小 的 内 存 块 (一 般 会 是 2MB) 来 做 栈 ， 这 个 栈 会 用 来 存储 当前 正 
在 被 调用 或 挂 起 ( 指 在 调用 其 它 函 数 时 ) 的 函数 的 内 部 变量 。 这 个 国定 大 小 的 栈 同 时 很 大 又 很 
小 。 因 为 2MB 的 栈 对 于 一 个 小 小 的 goroutine 来 说 是 很 大 的 内 存 浪费 ， 比 如 对 于 我 们 用 到 的 ， 
一 个 只 是 用 来 WaitGroup 之 后 关闭 channel 的 goroutine 来 说 。 而 对 于 go 程序 来 说 ， 同 时 创建 成 
百 上 千 个 gorutine 是 非常 普遍 的 ， 如 果 每 一 个 goroutine 都 需要 这 么 大 的 栈 的 话 ， 那 这 么 多 的 
goroutine 就 不 太 可 能 了 。 除 去 大 小 的 问题 之 外 ， 固 定 大 小 的 栈 对 于 更 复杂 或 者 更 深层 次 的 递 
昌 函 数 调 用 来 说 显然 是 不 够 的 。 修 改 固定 的 大 小 可 以 提升 空间 的 利用 率 允 许 创建 更 多 的 线 
程 ， 并 且 可 以 允许 更 深 的 递归 调用 ， 不 过 这 两 者 是 没 法 同时 兼备 的 。 


相反 ， 一 个 goroutine 会 以 一 个 很 小 的 栈 开始 其 生命 周期 ， 一 般 只 需要 2KB。 一 个 goroutine 的 
栈 ， 和 操作 系统 线程 一 样 ， 会 保存 其 活跃 或 挂 起 的 函数 调用 的 本 地 变量 ， 但 是 和 OS 线程 不 太 
一 样 的 是 一 个 goroutine 的 栈 大 小 并 不 是 固定 的 ; 栈 的 大 小 会 根据 需要 动态 地 伸缩 。 而 
goroutine 的 栈 的 最 大 值 有 1GB， 比 传统 的 固定 大 小 的 线程 栈 要 大 得 多 ， 尽 管 一 般 情况 下 ， 大 
多 goroutine 都 不 需要 这 么 大 的 栈 。 


练习 9.4: 创建 一 个 流水 线程 序 ， 支 持 用 channel 连 接任 意 数量 的 goroutine， 在 跑 爆 内 存 之 前 ， 
可 以 创建 多 少 流 水 线 阶 段 ? 一 个 变量 通过 整个 流水 线 需 要 用 多 久 ? (这 个 练习 题 翻译 不 是 很 确 
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9.8.2. Goroutine 调 度 
度 


OS 线 程 会 被 操作 系统 内 核 调度 。 每 几 毫 秒 ， 一 个 硬件 计时 器 会 中 断 处 理 器 ， 这 会 调用 一 个 叫 
作 scheduler 的 内 核 函 数 。 这 个 函数 会 挂 起 当前 执行 的 线程 并 保存 内 存 中 它 的 寄存 器 内 容 ， 检 
查 线程 列表 并 决定 下 一 次 哪个 线程 可 以 被 运行 ， 并 从 内 存 中 恢复 该 线程 的 寄存 器 信息 ， 然 后 
恢复 执行 该 线程 的 现场 并 开始 执行 线程 。 因 为 操作 系统 线程 是 被 内 核 所 调度 ， 所 以 从 一 个 线 
程 向 另 一 个 “移动 "需要 完整 的 上 下 文 切换 ， 也 就 是 说 ， 保 存 一 个 用 户 线程 的 状态 到 内 存 ， 人 恢复 
另 一 个 线程 的 到 寄存 器 ， 然 后 更 新 调度 器 的 数据 结构 。 这 几 步 操作 很 慢 ， 因 为 其 局 部 性 很 差 
需要 几 次 内 存 访问 ， 并 且 会 增加 运行 的 cpu 周 期 。 


Go 的 运行 时 包含 了 其 自己 的 调度 器 ， 这 个 调度 器 使 用 了 一 些 技术 手段 ， 比 如 m:n 调度 ， 因 为 
其 会 在 n 个 操作 系统 线程 上 多 工 (调度 )m 个 goroutine。Go 调 度 器 的 工作 和 内 核 的 调度 是 相似 
的 ， 但 是 这 个 调度 器 只 关注 单独 的 Go 程序 中 的 goroutine( 译 注 : 按 程序 独立 ) © 


和 操作 系统 的 线程 调度 不 同 的 是 ，Go 调 度 器 并 不 是 用 一 个 硬件 定时 器 而 是 被 Go 语言 "建筑 "本 
身 进行 调度 的 。 例 如 当 一 个 goroutine 调 用 了 time.Sleep 或 者 被 channel 调 用 或 者 mutex 操 作 阻 
塞 时 ， 调 度 器 会 使 其 进入 休眠 并 开始 执行 另 一 个 goroutine 直 到 时 机 到 了 再 去 唤醒 第 一 个 
goroutine。 因 为 因为 这 种 调度 方式 不 需要 进入 内 核 的 上 下 文 ， 所 以 重新 调度 一 个 goroutine 比 
调度 一 个 线程 代价 要 低 得 多 。 


练习 9.5: 写 一 个 有 两 个 goroutine 的 程序 ， 两 个 goroutine 会 向 两 个 无 buffer channel 反 复 地 发 送 
ping-pong 消 息 。 这 样 的 程序 每 秒 可 以 支持 多 少 次 通信 ? 


9.8.3. GOMAXPROCS 


Go 的 调度 器 使 用 了 一 个 叫做 GOMAXPROCS 的 变量 来 决定 会 有 多 少 个 操作 系统 的 ae 时 执 
行 Go 的 其 默认 的 值 是 运行 机 器 上 的 CPU 的 核心 数 ， 所 以 在 一 个 有 8 个 核心 的 机 器 

时 ， 调 度 器 一 次 会 在 8 个 OS 线程 上 去 调度 GO 代码 。(GOMAXPROCS 是 前 面 说 的 m:n 调度 的 

n)。 在 休眠 中 的 或 者 在 通信 中 被 阻塞 的 goroutine 是 不 需要 一 个 对 应 的 线程 来 做 调度 的 。 在 I/O 

中 或 系统 调用 中 或 调用 非 Go 语 言 函 数 时 ， 是 需要 一 个 对 应 的 操作 系统 线程 的 ， 但 是 

GOMAXPROCS 并 不 需要 将 这 几 种 情况 计数 在 内 。 


你 可 以 用 GOMAXPROCS 的 环境 变量 吕 显 式 地 控制 这 个 和 参数， 或 者 也 可 以 在 运行 时 用 
runtime.GOMAXPROCS 亏 数 来 修改 它 。 我 们 在 下 面 的 小 程序 中 会 看 到 GOMAXPROCS 的 效 
果 ， 这 个 程序 会 无 限 打 印 0 和 1。 


FORA 
go fmt.Print(0) 
fmt.Print(1) 

} 


$ GOMAXPROCS=1 go run hacker-cliché.go 
111111111111111111110000000000000000000011111... 


$ GOMAXPROCS=2 go run hacker-cliché.go 
010101010101010101011001100101011010010100110... 


在 第 一 次 执行 时 ， 最 多 同时 只 o ° 初始 情况 下 只 有 main goroutine 被 执 
行 ， 所 以 会 打印 很 多 1。 过 了 一 段 时 间 后 ，GO 调 度 器 会 将 其 置 为 休眠 ， 并 唤醒 另 一 个 
goroutine， 这 时 候 就 开始 打印 很 多 0 了 ， 在 打印 的 时 候 ， ee 度 到 操作 系统 线程 上 
的 。 在 第 二 次 执行 时 ， 我 们 使 用 了 两 个 操作 系统 线程 ， 所 以 两 个 goroutine 可 以 一 起 被 执行 ， 
以 同样 的 频率 交替 打印 0 和 1。 我 们 必须 强调 的 是 goroutine 的 调度 是 受 很 多 因子 影响 的 ， 而 
runtime 也 是 在 不 断 地 发 展演 进 的 ， 所 以 这 里 的 你 实际 得 到 的 结果 可 能 会 因为 版 本 的 不 同 而 与 
我 们 运行 的 结果 有 所 不 同 。 


练习 9.6: 测试 一 下 计算 密集 型 的 并 发 程序 (练习 8.5 那 样 的 ) 会 被 GOMAXPROCS 怎 样 影响 到 。 
在 你 的 电脑 上 最 佳 的 值 是 多 少 ? 你 的 电脑 CPU 有 多 少 个 核心 ? 


9.8.4. Goroutine < 4 ID => 


在 大 多 数 支持 多 线程 的 操作 系统 和 程序 语言 中 ， 当 前 的 线程 都 有 一 个 独特 的 身份 (id)， 并 且 这 
个 身份 信息 可 以 以 一 个 普通 值 的 形式 被 被 很 容易 地 获取 到 ， 典 型 的 可 以 是 一 个 integer 或 者 指 
针 值 。 这 种 情况 下 我 们 做 一 个 抽象 化 的 thread-local storage( 线 程 本 地 存储 ， 多 线程 编程 中 不 
希望 其 它 线程 访问 的 内 容 ) 就 很 容易 ， 只 需要 以 线程 的 id 作为 key 的 一 个 map 就 可 以 解决 问题 ， 
每 一 个 线程 以 其 id 就 能 从 中 获取 到 值 ， 且 和 其 它 线程 互 不 冲突 。 


goroutine 没 有 可 以 被 程序 员 获 取 到 的 身份 (id) 的 概念 。 这 一 点 是 设计 上 故意 而 为 之 ， 由 于 
thread-local storage 总 是 会 被 滥用 。 比 如 说 ， 一 个 web server 是 用 一 种 支持 tls 的 语言 实现 的 ， 
而 非常 普遍 的 是 很 多 函数 会 去 寻找 HTTP 请 求 的 信息 ， 这 代表 它们 就 是 去 其 存储 层 ( 这 个 存储 
层 有 可 能 是 tls) 查 找 的 。 这 就 像 是 那些 过 分 依赖 全 局 变量 的 程序 一 样 ， 会 导致 一 种 非 健康 的 “ 距 
离 外 行为 "， 在 这 种 行为 下 ， 一 个 防 数 的 行为 可 能 不 是 由 其 自己 内 部 的 变量 所 决定 ， 而 是 由 其 
所 运行 在 的 线程 所 决定 。 因 此 ， 如 果 线 程 本 身 的 身份 会 改变 一 比如 一 些 worker 线 程 之 类 的 
一 一 那么 函数 的 行为 就 会 变 得 神秘 莫 测 。 


Go 鼓励 更 为 简单 的 模式 ， 这 种 模式 下 参数 对 函数 的 影响 都 是 显 式 的 。 这 样 不 仅 使 程序 变 得 更 
易 读 ， 而 且 会 让 我 们 自由 地 向 一 些 给 定 的 函数 分 配子 任务 时 不 用 担心 其 身份 信息 影响 行为 。 


你 现在 应 该 已 经 明白 了 写 一 个 Go 程序 所 需要 的 所 有 语言 特性 信息 。 在 后 面 两 章节 中 ， 我 们 会 


回顾 一 些 之 前 的 实例 和 工具 ， 支 持 我 们 写 出 更 大 规模 的 程序 : 如 何 将 一 个 工程 组 织 成 一 系列 
的 包 ， 如 果 获 取 ， 构 建 ， 测 试 ， 性 能 测试 ， 剖 析 ， 写 文档 ， 并 且 将 这 些 包 分 享 出 去 。 


第 十 章 包 和 工具 


现在 随便 一 个 小 程序 的 实现 都 可 能 包含 超过 10000 个 函数 。 然 而 作者 一 般 只 需要 考虑 其 中 很 小 
的 一 部 分 和 做 很 少 的 设计 ， 因 为 绝 大 部 分 代码 都 是 由 他 人 编写 的 ， 它 们 通过 类 似 包 或 模块 的 
方式 被 重用 。 


Go 语言 有 超过 100 个 的 标准 包 (译注 : 可 以 用 go list std | wc -1 命令 查看 标准 包 的 具体 数 
A) ， 标 准 库 为 大 多 数 的 程序 提供 了 必要 的 基础 构件 。 在 Go 的 社区 ， 有 很 多 成 熟 的 nee 
计 、 共 享 、 重 用 和 改进 ， 目 前 互联 网 上 已 经 发 布 了 非常 多 的 Go 语音 开源 包 ， 它 们 可 以 通 
http://godoc.org 检索 。 在 本 章 ， 我 们 将 演示 如 果 使 用 已 有 的 包 和 创建 新 的 包 


Go 还 自 带 了 工具 箱 ， 里 面 有 很 多 用 来 简化 工作 区 和 包 管 理 的 小 工具 。 在 本 书 开始 的 时 候 ， 我 
们 已 经 见识 过 如 何 使 用 工具 箱 自 带 的 工具 来 下 载 、 构 件 和 运行 我 们 的 演示 程序 了 。 在 本 章 ， 
我 们 将 看 看 这 些 工具 的 基本 设计 理论 和 尝试 更 多 的 功能 ， 例 如 打印 工作 区 中 包 的 文档 和 查询 
相关 的 元 数据 等 。 在 下 一 章 ， 我 们 将 探讨 探索 包 的 单元 测试 用 法 。 


10.1. 包 简 介 


任何 包 系 统 设计 的 目的 都 是 为 了 简化 大 型 程序 的 设计 和 维护 工作 ， 通 过 将 一 组 相关 的 特性 放 
进 一 个 独立 的 单元 以 便于 理解 和 更 新 ， 在 每 个 单元 更 新 的 同时 保持 和 程序 中 其 它 单元 的 相对 
独立 性 。 这 种 模块 化 的 特性 允许 每 个 包 可 以 被 其 它 的 不 同 项 目 共 享 和 重用 ， 在 项 目 范围 内 、 
甚至 全 球 范围 统一 的 分 发 和 复 用 。 


每 个 包 一 般 都 定义 了 一 个 不 同 的 名 字 空 间 用 于 它 内 部 的 每 个 标识 符 的 访问 。 每 个 名 字 空 间 关 
联 到 一 个 特定 的 包 ， 让 我 们 给 类 型 、 亏 数 等 选择 简短 明了 的 名 字 ， 这 样 可 以 避免 在 我 们 使 用 
它们 的 时 候 减 少 和 其 它 部 分 名 字 的 冲突 。 


每 个 包 还 通过 控制 包 内 名 字 的 可 见 性 和 是 否 导 出 来 实现 封装 特性 。 通 过 限制 包 成 员 的 可 见 性 
并 隐藏 包 API 的 具体 实现 ， 将 允许 包 的 维护 者 在 不 影响 外 部 包 用 户 的 前 提 下 调整 包 
ee IRA LA RAT UE > RT VAR A Pat HAG HKG fe BHA RB 

这 样 可 以 保证 内 部 变量 的 一 致 性 和 并 发 时 的 互 太 约束 。 


当 我 们 修改 了 一 个 源 文件 ， 我 们 必须 重新 编译 该 源 文 件 对 应 的 包 和 所 有 依赖 该 包 的 其 他 包 
即使 是 从 头 构建 ，Go 语 言 编译 器 的 编译 速度 也 明显 快 于 其 它 编译 语言 。Go 语 言 的 闪电 般 的 编 
译 速 度 主要 得 益 于 三 个 语言 特性 。 第 一 点 ， 所 有 导入 的 包 必 须 在 每 个 文件 的 开头 显 式 声明 ， 
这 样 的 话 编 译 器 就 没有 必要 读 取 和 分 析 整 个 源 文件 来 判断 包 的 依赖 关系 。 第 二 点 ， 禁 止 包 的 
环 状 依赖 ， 因 为 没有 循环 依赖 ， 包 的 依赖 关系 形成 一 个 有 向 无 环 图 ， 每 个 包 可 以 被 独立 编 

译 ， 而 且 很 可 能 是 被 并 发 编译 。 第 三 点 ， 编 译 后 包 的 目标 文件 不 仅仅 记录 包 本 身 的 导出 信 

息 ， 目 标 文件 同时 还 记录 了 包 的 依赖 关系 。 因 此 ， 在 编译 一 个 包 的 时 候 ， 编 译 器 只 需要 读 取 
每 个 直接 导入 包 的 目标 文件 ， 而 不 需要 遍历 所 有 依赖 的 的 文件 (译注 : 很 多 都 是 重复 的 间接 
依赖 ) 。 


10.2. 导入 路 径 


是 由 一 个 全 局 唯一 的 字符 串 所 标识 的 导入 路 径 定位 。 出 现在 import 语 名 中 的 导入 路 径 也 
ẹ 


import ( 
"Pme" 
"math/rand" 
"encoding/json" 


"golang.org/x/net/htm1" 


"github.com/go-sql-driver/mysql" 


就 像 我 们 在 2.6.1 节 提 到 过 的 ，Go 语 言 的 规范 并 没有 指明 包 的 导入 路 径 字 符 串 的 具体 含义 ， 导 
入 路 径 的 具体 含义 是 由 构建 工具 来 解释 的 。 在 本 章 ， 我 们 将 深入 讨论 Go 语言 工具 箱 的 功能 ， 
包括 大 家 经 常 使 用 的 构建 测试 等 功能 。 当 然 ， 也 有 第 三 方 扩展 的 工具 箱 存 在 。 例 如 ，Google 
公司 内 部 的 Go 语言 码 农 ， 他 们 就 使 用 内 部 的 多 语言 构建 系统 (译注 : Google 公 司 使 用 的 是 类 
似 Bazel 的 构建 系统 ， 支 持 多 种 编程 语言 ， 目 前 该 构件 系统 还 不 能 完整 支持 Windows 环 境 ) ， 
用 不 同 的 规则 来 处 理 包 名 字 和 定位 包 ， 用 不 同 的 规则 来 处 理 单元 测试 等 等 ， 因 为 这 样 可 以 更 
紧密 适 配 他 们 内 部 环境 。 

如 果 你 计划 分 享 或 发 布 包 ， 那 么 导入 路 径 最 好 是 全 球 唯一 的 。 为 了 避免 冲突 ， 所 有 非 标准 库 
包 的 导入 路 径 建 议 以 所 在 组 织 的 互联 网 域名 为 前 组 ; 而 且 这 样 也 有 利于 包 的 检索 。 例 如 ， 上 
面 的 import 语 句 导 入 了 Go 团队 维护 的 HTML 解 析 器 和 一 个 流行 的 第 三 方 维护 的 MySQL 驱 动 。 


10.3. ae A 


在 每 个 Go 语音 源 文件 的 开头 都 必须 有 包 声 明 语句 。 包 声明 语句 的 主要 目的 是 确定 当前 包 被 其 
它 包 导入 时 默认 的 标识 符 (也 称 为 包 名 ) 。 


例如 ，math/rand 包 的 每 个 源 文件 的 开头 都 包含 package rand 包 声 明 语句 ， 所 以 当 你 导入 这 个 
包 ， 你 就 可 以 用 rand.Int、rand.Float64 类 似 的 方式 访问 包 的 成 员 。 


package main 


import ( 
"Pme" 
"math/rand" 


) 


func main() { 
fmt.Println(rand.Int()) 
} 


通常 来 说 ， 默 认 的 包 名 就 是 包 导 入 路 径 名 的 最 后 一 段 ， 因 此 即使 两 个 包 的 导入 路 径 不 同 ， 它 
们 依然 可 能 有 一 个 相同 的 包 名 。 例 如 ，math/rand 包 和 crypto/rand 包 的 包 名 都 是 rand。 稍 后 我 
们 将 看 到 如 何 同时 导入 两 个 有 相同 包 名 的 包 。 


关于 默认 包 名 一 般 采 用 导入 路 径 名 的 最 后 一 段 的 约定 也 有 三 种 例外 情况 。 第 一 个 例外 ， 包 对 
应 一 个 可 执行 程序 ， 也 就 是 main 包 ， 这 时 候 main 包 本 身 的 导入 路 径 是 无 关 紧 要 的 。 名 字 为 
main 的 包 是 给 go build (§10.7.3) 构建 命令 一 个 信息 ， 这 个 包 编 译 完 之 后 必须 调用 连接 器 生 
成 一 个 可 执行 程序 。 


第 二 个 例外 ， 包 所 在 的 目录 中 可 能 有 一 些 文件 名 是 以 test.go 为 后 级 的 Go 源 文件 (译注 : 前 面 
必须 有 其 它 的 字符 ， 因 为 以 "前 缓 的 源 文件 是 被 忽略 的 ) ， 并 且 这 些 源 文件 声明 的 包 名 也 是 以 
_test 为 后 级 名 的 。 这 种 目录 可 以 包含 两 种 包 : 一 种 普通 包 ， 加 一 种 则 是 测试 的 外 部 扩展 包 。 
所 有 以 test 为 后 缓和 包 名 的 测试 外 部 扩展 包 都 由 go test 命 令 独立 编译 ， 普 通 包 和 测试 的 外 部 扩 
展 包 是 相互 独立 的 。 测 试 的 外 部 扩展 包 一 般 用 来 避免 测试 代码 中 的 循环 导入 依赖 ， 具 体 细节 
我 们 将 在 11.2.4 节 中 介绍 。 


第 三 个 例外 ， 一 些 依 赖 版 本 号 的 管理 工具 会 在 导入 路 径 后 追加 版 本 号 信息 ， 例 
如 "gopkg.in/yaml.v2"。 这 种 情况 下 包 的 名 字 并 不 包 侈 版 本 号 后 级， 而 是 yaml。 


10.4. 导入 声明 


可 以 在 一 个 Go 语言 源 文件 包 声明 语句 之 后 ， 其 它 非 导 入 声明 语句 之 前 ， 包 含 零 到 多 个 导入 包 
声明 语句 。 每 个 导入 声明 可 以 单独 指定 一 个 导入 路 径 ， 也 可 以 通过 圆 括 号 同时 导入 多 个 导入 
路 径 。 下 面 两 个 导入 形式 是 等 价 的 ， 但 是 第 二 种 形式 更 为 常见 。 


import "fmt" 
import "os" 


import ( 
"EMES 
Osi 


导入 的 包 之 间 可 以 通过 添加 空 行 来 分 组 ; 通常 将 来 自 不 同 组 织 的 包 独自 分 组 。 包 的 导入 顺序 
无 关 紧 要 ， 但 是 在 每 个 分 组 中 一 般 会 根据 字符 串 顺序 排列 。 (gofmt 和 goimports 工 具 都 可 以 将 
不 同 分 组 导入 的 包 独 立 排序 。) 


import ( 
Mm 
"html/template" 
Nos 


"golang.org/x/net/htm1" 
"golang.org/x/net/ipv4" 


如 果 我 们 想 同 时 导入 两 个 有 着 名 字 相 同 的 包 ， 例 如 math/rand 包 和 crypto/rand 包 ， 那 么 导入 声 
明 必 须 至 少 为 一 个 同名 包 指定 一 个 新 的 包 名 以 避免 冲突 。 这 叫做 导入 包 的 重 命名 。 


import ( 
"crypto/rand" 
mrand "math/rand" // alternative name mrand avoids conflict 


导入 包 的 重 命名 只 影响 当前 的 源 文 件 。 其 它 的 源 文 件 如 果 导 入 了 相同 的 包 ， 可 以 用 导入 包 原 
本 默认 的 名 字 或 重 命名 为 另 一 个 完全 不 同 的 名 字 。 


导入 包 重 命名 是 一 个 有 用 的 特性 ， 它 不 仅仅 只 是 为 了 解决 名 字 冲 突 。 如 果 导 入 的 一 个 包 名 很 
策 重 ， 特 别 是 在 一 些 自动 生成 的 代码 中 ， 这 时 候 用 一 个 简短 名 称 会 更 方便 。 选 择 用 简短 名 称 
重 命名 导入 包 时 候 最 好 统一 ， 以 避免 包 名 混乱 。 选 择 另 一 个 包 名 称 还 可 以 帮助 避免 和 本 地 普 


通 变量 名 产生 冲突 。 例 如 ， 如 果 文 件 中 已 经 有 了 一 个 名 为 path 的 变量 ， 那 么 我 们 可 以 
将 "path" 标 准 包 重 命名 为 pathpkg。 


每 个 导入 声明 语句 都 明确 指定 了 当前 包 和 被 导入 包 之 间 的 依赖 关系 。 如 果 遇 到 和 包 循环 导入 的 
情况 ，Go 语 言 的 构建 工具 将 报告 错误 。 


10.5. 包 的 匿名 导入 


如 果 只 是 导入 一 个 包 而 并 不 使 用 导入 的 包 将 会 导致 一 个 编译 错误 。 但 是 有 时 候 我 们 只 是 想 利 
用 导入 包 而 产生 的 副作用 : 它 会 计算 包 级 变量 的 初始 化 表达 式 和 执行 导入 包 的 init 初 始 化 函数 

(§2.6.2) 。 这 时 候 我 们 需要 抑制 ‘Unused import" 编 译 错误 ， 我 们 可 以 用 下 划 线 _ 来 重 命名 
导入 的 包 。 像 往常 一 样 ， 下 划 线 _ 为 空白 标识 符 ， 并 不 能 被 访问 。 


import _ "image/png" // register PNG decoder 


这 个 被 称 为 包 的 匿名 导入 。 它 通常 是 用 来 实现 一 个 编译 时 机 制 ， 然 后 通过 在 main 主 程序 入 口 
选择 性 地 导入 附加 的 包 。 首 先 ， 让 我 们 看 看 如 何 使 用 该 特性 ， 然 后 再 看 看 它 是 如 何 工 作 的 。 
标准 库 的 image 图 像 包 包含 了 一 个 pecode 函数 ， 用 于 从 io.Reader 接口 读 取 数 据 并 解码 图 
像 ， 它 调用 底层 注册 的 图 像 解码 器 来 完成 任务 ， 然 后 返回 image.Image 类 型 的 图 像 。 使 

用 image.Decode 很 容易 编写 一 个 图 像 格式 的 转换 工具 ， 读 取 一 种 格式 的 图 像 ， 然 后 编码 为 另 
一 种 图 像 格式 : 


gopl.io/ch10/jpeq 


// The jpeg command reads a PNG image from the standard input 
// and writes it as a JPEG image to the standard output. 
package main 


import ( 
amie 
"image" 
"image/jpeg" 
_ "image/png" // register PNG decoder 
Nao" 


"os" 


func main() { 
if err := toJPEG(os.Stdin, os.Stdout); err != nil { 
fmt.Fprintf(os.Stderr, "jpeg: %v\n", err) 


os.Exit(1) 
} 
} 
func toJPEG(in io.Reader, out io.Writer) error { 
img, kind, err := image.Decode(in) 
if err != nil { 


return err 


} 
fmt.Fprintln(os.Stderr, "Input format =", kind) 
return jpeg.Encode(out, img, &jpeg.Options{Quality: 95}) 


如 果 我 们 将 gopl.io/ch3/mandelbrot (§3.3) 的 输出 导入 到 这 个 程序 的 标准 输入 ， 它 将 解码 输 
入 的 PNG 格 式 图 像 ， 然 后 转换 为 JPEG 格 式 的 图 像 输出 〈 图 3.3) 。 


$ go build gopl.io/ch3/mandelbrot 

$ go build gopl.io/ch10/jpeg 

$ ./mandelbrot | ./jpeg >mandelbrot.jpg 
Input format = png 


要 注意 image/png 包 的 匿名 导入 语句 。 如 果 没 有 这 一 行 语句 ， 程 序 依然 可 以 编译 和 运行 ， 但 是 
它 将 不 能 正确 识别 和 解码 PNG 格 式 的 图 像 : 


$ go build gopl.io/ch10/jpeg 
$ ./mandelbrot | ./jpeg >mandelbrot.jpg 
jpeg: image: unknown format 


下 面 的 代码 演示 了 它 的 工作 机 制 。 标 准 库 还 提供 了 GIF、PNG 和 JPEG 等 格式 图 像 的 解码 器 ， 
用 户 也 可 以 提供 自己 的 解码 器 ， 但 是 为 了 保持 程序 体积 较 小 ， 很 多 解码 器 并 没有 被 全 部 包 
含 ， 除 非 是 明确 需要 支持 的 格式 。image.Decode 函 数 在 解码 时 会 依次 查询 支持 的 格式 列表 。 


每 个 格式 驱动 列表 的 每 个 入 口 指定 了 四 件 事 情 : 格式 的 名 称 ; 一 个 用 于 描述 这 种 图 像 数据 开 
头 部 分 模式 的 字符 囊 ， 用 于 解码 器 检测 识别 ; 一 个 Decode 函 数 用 于 完成 解码 图 像 工 作 ; 一 
DecodeConfig 函 数 用 于 解码 图 像 的 大 小 和 颜色 空间 的 信息 。 每 个 驱动 入 口 是 通 过 调用 
image.RegisterFormat 驾 数 注册 ， 一 般 是 在 每 个 格式 包 的 init 初 始 化 函数 中 调用 ， 例 如 
image/png 包 是 这 样 注 册 的 : 


package png // image/png 


func Decode(r io.Reader) (image.Image, error) 
func DecodeConfig(r io.Reader) (image.Config, error) 


func init() { 
const pngHeader = "\x89PNG\r\n\x1ta\n" 
image.RegisterFormat("png", pngHeader, Decode, DecodeConfig) 


最 终 的 效果 是 ， 主 程序 只 需要 匿名 导入 特定 图 像 驱 动 包 就 可 以 用 image.Decode 解 码 对 应 格式 
的 图 像 了 。 


数据 库 包 database/sql 也 是 采用 了 类 似 的 技术 ， 让 用 户 可 以 根据 自己 需要 选择 导入 必要 的 数据 
库 驱 动 。 例 如 : 


import ( 
"database/sql" 
ee "github.com/1ib/pq" // enable support for Postgres 
— "github.com/go-sql-driver/mysql" // enable support for MySQL 


db, err = sql.Open("postgres", dbname) // OK 
db, err = sql.Open("mysql", dbname) // OK 
db, err = sql.Open("sqlite3", dbname) // returns error: unknown driver "sqlite3" 


练习 10.1: 扩展 jpeg 程 序 ， 以 支持 任意 图 像 格式 之 间 的 相互 转换 ， 使 用 image.Decode 检 测 支 
持 的 格式 类 型 ， 然 后 通过 flag 命 令 行 标志 参数 选择 输出 的 格式 。 


练习 10.2 : 设计 一 个 通用 的 压缩 文件 读 取 框架 ， 用 来 读 取 ZIP (archive/zip) 和 POSIX 
tar (arehyelar, 格式 压缩 的 文档 。 使 用 类 似 上 面 的 注册 技术 来 扩展 支持 不 同 的 压缩 格式 ， 然 
后 根据 需要 通过 匿名 导入 选择 导入 要 支持 的 压缩 格式 的 驱动 包 


10.6. 包 和 命名 


在 本 节 中 ， 我 们 将 提供 一 些 关 于 Go 语言 独特 的 包 和 成 员 命名 的 约定 。 


当 创 建 一 个 包 ， 一 般 要 用 短小 的 包 名 ， 但 也 不 能 大 短 导致 难以 理解 。 标 准 库 中 最 常用 的 包 有 
bufio ` bytes 、flag、fmt、http、io、json、os、sort、sync 和 time 等 包 


它们 的 名 字 都 简洁 明了 。 例 如 ， 不 要 将 一 个 类 似 imageutil 或 ioutilis 的 通用 包 命 名 为 util， 虽 然 


它 看 起 来 很 短小 。 要 尽量 避免 包 名 使 用 可 能 被 经 常用 于 局 部 变量 的 名 字 ， 这 样 可 能 导致 用 户 
重 命名 导入 包 ， 例 如 前 面 看 到 的 path 包 


包 名 一 般 采 用 单数 的 形式 。 标 准 库 的 bytes、errors 和 strings 使 用 了 复数 形式 ， 这 是 为 了 避免 
和 预定 义 的 类 型 冲突 ， 同 样 还 有 go/types 是 为 了 避免 和 type 关 键 字 冲突 。 


要 避免 包 名 有 其 它 的 含义 。 例 如 ，2.5 节 中 我 们 的 温度 转换 包 最 初 使 用 了 temp 包 名 ， 虽 然 并 没 
有 持续 多 久 。 但 这 是 一 个 糟糕 的 尝试 ， 因 为 temp 几 乎 是 临时 变量 的 同义词 。 然 后 我 们 有 一 段 
时 间 使 用 了 temperature 作 为 包 名 ， 虽 然 名 字 并 没有 表达 包 的 丨 实用 途 。 最 后 我 们 改 成 了 和 
strconv 标 准 包 类 似 的 tempconv 包 名 ， 这 个 名 字 比 之 前 的 就 好 多 了 。 


现在 让 我 们 看 看 如 何 命 名 包 的 成 员 。 由 于 是 通过 包 的 导入 名 字 引 入 包 里 面 的 成 员 ， 例 如 
fmt.Println ， 同 时 ee 息 。 ， 我 们 一 般 并 不 需要 关注 Println 的 具体 内 
容 ， 因 为 fmt 包 名 已 经 包含 了 这 个 信息 。 当 设计 一 个 包 的 时 候 ， 需 要 考虑 包 名 和 成 员 名 两 个 部 
分 如 何 很 好 地 配合 。 下 面 有 一 些 例 F : 


bytes.Equal flag.Int http.Get json.Marshal 


我 们 可 以 看 到 一 些 常用 的 命名 模式 。sitrings 包 提供 了 和 字符 串 相 关 的 诸多 操作 : 


package strings 


func Index(needle, haystack string) int 


type Replacer struct /* ... */ } 
func NewReplacer(oldnew ...string) *Replacer 
type Reader struct{ /* ... */ } 


func NewReader(s string) *Reader 


字符 串 string 本 身 并 没有 出 现在 每 个 成 员 名 字 中 。 因 为 用 户 会 这 样 引用 这 些 成 员 
strings.Index、strings.Replacer 等 。 


其 它 一 些 包 ， 可 能 只 描述 了 单一 的 数据 类 型 ， 例 如 html/template 和 math/rand 等 ， 只 暴露 一 个 
主要 的 数据 结构 和 与 它 相 关 的 方法 ， 还 有 一 个 以 New 命 名 的 函数 用 于 创建 实例 。 


package rand // "math/rand" 


type Rand struct{ /* ... */ } 
func New(source Source) *Rand 


这 可 能 导致 一 些 名 字 重 复 ， 例 如 template.Template 或 rand.Rand， 这 就 是 为 什么 这 些 种 类 的 包 
名 往往 特别 短 的 原因 之 一 。 


在 另 一 个 极端 ， 还 有 像 net/http 包 那样 含有 非常 多 的 名 字 和 种 类 不 多 的 数据 类 型 ， 因 为 它们 都 
是 要 执行 一 个 复杂 的 复合 任务 。 尽 管 有 将 近 二 十 种 类 型 和 更 多 的 函数 ， 但 是 包 中 最 重要 的 成 
员 名 字 却 是 简单 明了 的 : Get、Post、Handle、Error、Client、Server 等 。 


10.7. 工具 


本 章 剩 下 的 部 分 将 讨论 Go 语言 工具 箱 的 具体 功能 ， 包 括 如 何 下 载 、 格 式 化 、 构 建 、 测 试 和 安 
装 Go 语 言 编写 的 程序 。 


Go 语言 的 工具 箱 集 合 了 一 系列 的 功能 的 命令 集 。 它 可 以 看 作 是 一 个 包 管 理 器 (类似 于 Linux 中 
的 apt 和 rpm 工 具 ) ， 用 于 包 的 查询 、 计 算 的 包 依 赖 关系 、 从 远程 版 本 控制 系统 和 下 载 它 们 等 
任务 。 它 也 是 一 个 构建 系统 ， 计 算 文 件 的 依赖 关系 ， 然 后 调用 编译 器 、 汇 编 器 和 连接 器 构建 
程序 ， 虽 然 它 故意 被 设计 成 没有 标准 的 make 命 令 那么 复杂 。 它 也 是 一 个 单元 测试 和 基准 测试 
的 驱动 程序 ， 我 们 将 在 第 11 章 讨论 测试 话题 。 

Go 语言 工具 箱 的 命令 有 着 类 似 “ 瑞 士 军刀 ”的 风格 ， 带 着 一 打 子 的 子 命令 ， 有 一 些 我 们 经 常用 
到 ， 例 如 get、run、build 和 fmt 等 。 你 可 以 运行 go 或 go help 命 令 查 看 内 置 的 帮助 文档 ， 为 了 查 
询 方 便 ， 我 们 列 出 了 最 常用 的 命令 : 


$ go 
build compile packages and dependencies 
clean remove object files 
doc show documentation for package or symbol 
env print Go environment information 
fmt run gofmt on package sources 
get download and install packages and dependencies 
install compile and install packages and dependencies 
list list packages 
run compile and run Go program 
test test packages 
version print Go version 
vet run go tool vet on packages 


Use "go help [command]" for more information about a command. 


为 了 达到 零 配置 的 设计 目标 ，Go 语 言 的 工具 箱 很 多 地 方 都 依赖 各 种 约定 。 例 如 ， 根 据 给 定 的 
源 文件 的 名 称 ，Go 语 言 的 工具 可 以 找到 源 文件 对 应 的 包 ， 因 为 每 个 目录 只 包含 了 单一 的 包 ， 
并 且 到 的 导入 路 径 和 工作 区 的 目录 结构 是 对 应 的 。 给 定 一 个 包 的 导入 路 径 ，Go 语 言 的 工具 可 
以 找到 对 应 的 目录 中 没 个 实体 对 应 的 源 文件 。 它 还 可 以 根据 导入 路 径 找到 存储 代码 仓库 的 远 
程 服务 器 的 URL © 


10.7.1. 工作 区 结构 


对 于 大 多 数 的 Go 语言 用 户 ， 只 需要 配置 一 个 名 叫 GOPATH 的 环境 变量 ， 用 来 指定 当前 工作 目 
录 即 可 。 当 需要 切换 到 不 同 工 作 区 的 时 候 ， 只 要 更 新 GOPATH 就 可 以 了 。 例 如 ， 我 们 在 编写 
本 书 时 将 GOPATH 设 置 为 $HoME/gobook : 


$ export GOPATH=$HOME/gobook 
$ go get gopl.io/... 


当 你 用 前 面 介绍 的 命令 下 载 本 书 全 部 的 例子 源码 之 后 ， 你 的 当前 工作 区 的 目录 结构 应 该 是 这 
样 的 : 


GOPATH/ 
src/ 
gopl.io/ 
.git/ 
ch1/ 
helloworld/ 
main.go 
dup/ 
main.go 


golang.org/x/net/ 
.git/ 
htm1/ 
parse.go 
node.go 


bin/ 
helloworld 
dup 

pkg/ 
darwin_amd64/ 


GOPATH 对 应 的 工作 区 目录 有 三 个 子 目录 。 其 中 src 子 目录 用 于 存储 源 代码 。 每 个 包 被 保存 在 
与 $GOPATH/src 的 相对 路 径 为 包 导 入 路 径 的 子 目录 中 ， 例 如 gopl.io/ch1T/helloworld 相 对 应 的 路 
径 目 录 。 我 们 看 到 ， 一 个 GOPATH 工 作 区 的 src 目 录 中 可 能 有 多 个 独立 的 版 本 控制 系统 ， 例 如 
gopl.io 和 golang.org 分 别 对 应 不 同 的 Git 仓 库 。 其 中 pkg 子 目录 用 于 保存 编译 后 的 包 的 目标 文 

件 ，bin 子 目录 用 于 保存 编译 后 的 可 执行 程序 ， 例 如 helloworld 可 执行 程序 。 


第 二 个 环境 变量 GOROOT 用 来 指定 Go 的 安装 目录 ， 还 有 它 自 带 的 标准 库 包 的 位 置 。 
GOROOT 的 目录 结构 和 GOPATH 类 似 ， 因 此 存放 fmt 包 的 源 代 码 对 应 目录 应 该 为 
$GOROOT/src/fmt。 用 户 一 般 不 需要 设置 GOROOT， 上 默认 情况 下 Go 语言 安装 工具 会 将 其 设 
置 为 安装 的 目录 路 径 


其 中 go env 命令 用 于 查看 Go 语音 工具 涉及 的 所 有 环境 变量 的 值 ， 包 括 未 设置 环境 变量 的 默认 
值 。GOOS 环 境 变量 用 于 指定 目标 操作 系统 〈 例 如 android、linux、darwin 或 windows) ， 
GOARCH 环 境 变 量 用 于 指定 处 理 器 的 类 型 ， 例 如 amd64、386 或 arm 等 。 虽 然 GOPATH 环 境 变 
量 是 唯一 必需 要 设置 的 ， 但 是 其 它 环境 变量 也 会 偶尔 用 到 。 


$ go env 
GOPATH="/home/gopher/gobook" 
GOROOT="/usr/local/go" 
GOARCH="amd64" 

GOOS="darwin" 


10.7.2. 下 载 包 


使 用 Go 语言 工具 箱 的 go 命令 ， 不 仅 可 以 根据 包 导 入 路 径 找到 本 地 工作 区 的 包 ， 其 至 可 以 从 互 
联网 上 找到 和 更 新 包 。 


使 用 命令 go get 可 以 下 载 一 个 单一 的 包 或 者 用 ... 下 载 整 个 子 目 录 里 面 的 每 个 包 。GoO 语 言 
工具 箱 的 go 命令 同时 计算 并 下 载 所 依赖 的 每 个 包 ， 这 也 是 前 一 个 例子 中 golang.org/x/net/html 
自动 出 现在 本 地 工作 区 目录 的 原因 。 


一 旦 go get 命令 下 载 了 包 ， 然 后 就 是 安装 包 或 包 对 应 的 可 执行 的 程序 。 我 们 将 在 下 一 节 再 关 
注 它 的 细节 ， 现 在 只 是 展示 整个 下 载 过 程 是 如 何 的 简单 。 第 一 个 命令 是 获取 golint 工 具 ， 它 用 
于 检测 Go 源 代码 的 编程 风格 是 否 有 问题 。 第 二 个 命令 是 用 golint 命 令 对 2.6.2 节 的 
gopl.io/ch2/popcount 包 代码 进行 编码 风格 检查 。 它 友好 地 报告 了 忘记 了 包 的 文档 : 


$ go get github.com/golang/lint/golint 
$ $GOPATH/bin/golint gopl.io/ch2/popcount 
src/gopl.io/ch2/popcount/main.go:1:1: 


package comment should be of the form "Package popcount ... 


go get 命令 支持 当前 流行 的 托管 网 站 GitHub、Bitbucket 和 Launchpad， 可 以 直接 向 它们 的 版 
本 控制 系统 请 求 代码 。 对 于 其 它 的 网 站 ， 你 可 能 需要 指定 版 本 控制 系统 的 具体 路 径 和 协议 ， 
例如 Git 或 Mercurial。 运 行 go help importpath 获取 相关 的 信息 。 


go get 命令 获取 的 代码 是 真实 的 本 地 存储 仓库 ， 而 不 仅仅 只 是 复制 源 文件 ， 因 此 你 依然 可 以 
使 用 版 本 管理 工具 比较 本 地 代码 的 变更 或 者 切换 到 其 它 的 版 本 。 例 如 golang.org/x/net 包 目录 
对 应 一 个 Git 仓 库 : 


$ cd $GOPATH/src/golang.org/x/net 

$ git remote -v 

origin https://go.googlesource.com/net (fetch) 
origin https://go.googlesource.com/net (push) 


RREH LFABESA 1 SEM Fo AMG HE Me AIRF HOHE H KAA > AKL Git 
地 址 是 go.googlesource.com。 这 其 实 是 Go 语言 工具 的 一 个 特性 ， 可 以 让 包 用 一 个 自 定义 的 导 
入 路 径 ， 但 是 真实 的 代码 却 是 由 更 通用 的 服务 提供 ， 例 如 googlesource.com 或 github.com ° 
因为 页 面 https://golang.org/x/net/html 包含 了 如 下 的 元 数据 ， 它 告诉 Go 语言 的 工具 当前 包 监 
实 的 Git 仓 库 托管 地 址 : 


$ go build gopl.io/chi/fetch 
$ ./fetch https://golang.org/x/net/html | grep go-import 
<meta name="go-import" 
content="golang.org/x/net git https://go.googlesource.com/net"> 


如 果 指 定 - 如 人 信行 村 志和 参数， go get 命令 将 确保 所 有 的 包 和 依赖 的 包 的 版 本 都 是 最 新 的 ， 
然后 重新 编译 和 安装 它们 。 如 果 不 包含 该 标 ， ae 而 且 如 果 包 已 经 在 本 地 存在 ， 那 么 
代码 那么 将 不 会 被 自动 更 新 。 


go get -u 命令 只 是 简单 地 保证 每 个 包 是 最 新 版 本 ， 如 果 是 第 一 次 下 载 包 则 是 比较 很 方便 
的 ; AR 可 能 是 不 合适 的 ， 因 为 本 地 程序 可 能 需要 对 依赖 的 包 做 精确 的 版 本 
依赖 管理 。 通 常 的 解决 方案 是 使 用 vendor 的 目录 用 于 存储 依赖 包 的 固定 版 本 的 源 代码 ， 对 本 
地 依赖 的 包 ane EL fe de EF] FE AQ o HEGO1.5Z BY > ARH RGRAY SABLE > 
PR VA A #i X golang.org/x/net/html-& A % 42 T fe & È A gopl.io/vendor/golang.org/x/net/html ° 
最 新 的 Go 语言 命令 已 经 支持 vendor 特 性 ， 但 限于 篇 幅 这 里 并 不 讨论 vendor 的 具体 细节 。 不 过 
可 以 通过 go help gopath 命令 查看 Vendor 的 帮助 文档 。 


练习 10.3: 从 http://gopl.io/ch1/helloworld?go-get=1 获取 内 容 ， 查 看 本 书 的 代码 的 站 实 托管 
的 网 址 ( go get 请 求 HTML 页 面 时 包含 了 go-get 参数 ， 以 区 别 普通 的 浏览 器 请 求 ) 。 


10.7.3. 构建 包 


go build 4P 命令 编译 命令 行 参 数 指定 的 每 个 包 。 如 果 包 是 一 个 库 ， 则 忽略 输出 结果 ; 这 可 以 用 
于 检测 包 的 可 以 正确 编译 的 。 如 果 包 的 名 字 是 main ， go build 将 调用 连接 器 在 当前 目录 创建 
一 个 可 执行 程序 ; 以 导入 路 径 的 最 后 一 段 作为 可 执行 程序 的 名 字 。 


因为 每 个 目录 只 包含 Seale 可 执行 程序 或 者 叫 Unix 术 语 中 的 命令 的 包 ， 会 要 
求 放 到 一 个 独立 的 目 Se 这 些 目录 有 时 候 会 放 在 名 叫 cmd 目 录 的 子 目 录 下 面 ， 例 如 用 于 提供 
Go 文档 服务 的 golang.org/xjtools/cmd/godoc 命 令 就 是 放 在 cmd 子 目录 (§10.7.4) ° 


个 包 可 以 由 它们 的 导入 路 径 指 定 ， 就 像 前 面 看 到 的 那样 ， 或 者 用 一 个 相对 目录 的 路 径 知 指 
A n PATR Eo A th ， 开头 。 如 果 没 有 指定 参数 ， 那 么 默认 指定 为 当前 目录 对 应 的 
。 下 面 的 命令 用 于 构建 同一 个 包 , 虽然 它们 的 写法 各 不 相同 : 


$ cd $GOPATH/src/gopl.io/ch1/helloworld 
$ go build 


或 者 : 


$ cd anywhere 
$ go build gopl.io/chi/helloworld 


或 者 : 


$ cd $GOPATH 
$ go build ./src/gopl.io/chi/helloworld 


$ cd $GOPATH 
$ go build src/gopl.io/chi/helloworld 
Error: cannot find package "src/gopl.io/chi/helloworld". 


也 可 以 指定 包 的 源 文 件 列表 ， 这 一 般 这 只 用 于 构建 一 些小 程序 或 做 一 些 临 时 性 的 实验 。 如 果 
是 main 包 ， 将 会 以 第 一 个 Go 源 文件 的 基础 文件 名 作为 最 终 的 可 执行 程序 的 名 字 。 


$ cat quoteargs.go 
package main 


import ( 
"Fmt" 


"os" 


func main() { 
fmt.Printf("%q\n", os.Args[1:]) 


} 

$ go build quoteargs.go 

$ ./quoteargs one "two three" four\ five 
"one" "two three" "four five"] 


特别 是 对 于 这 类 一 次 性 运行 的 程序 ， 我 们 希望 尽快 的 构建 并 运行 它 。 go run PSK RL 
We 的 两 个 步骤 : 


$ go run quoteargs.go one "two three" four\ five 
"one" "two three" "four five"] 


第 一 行 的 参数 列表 中 ， 第 一 个 不 是 以 .go 结尾 的 将 作为 可 执行 程序 的 参数 运行 。 


默认 情况 下 ， go build 命令 构建 指定 的 包 和 它 依赖 的 包 ， 然 后 丢弃 除了 最 后 的 可 执行 文件 之 
外 所 有 的 中 间 编 译 结果 。 依 赖 分 析 和 编译 过 程 虽然 都 是 很 快 的 ， 但 是 随 着 项 目 增加 到 几 十 个 
包 和 成 千 上 万 行 代码 ， 依 赖 关 系 分 析 和 编译 时 间 的 消耗 将 变 的 可 观 ， 有 时 候 可 能 需要 几 秒 
种 ， 即 使 这 些 依赖 项 没有 改变 。 


go install 命令 和 go build 命令 很 相似 ， 但 是 它 会 保存 每 个 包 的 编译 成 果 ， 而 不 是 将 它们 都 
丢弃 。 被 编译 的 包 会 被 保存 到 $GOPATH/pkg 目 录 下 ， 目 录 路 径 和 src 目录 路 径 对 应 ， 可 执行 
程序 被 保存 到 $GOPATH/bin 目 录 。 (很 多 用 户 会 将 $GOPATH/bin 添 加 到 可 执行 程序 的 搜索 列 
RFP o ) 还 有 ” go install P 命令 和 go build 4P 命令 都 不 会 重新 编译 没有 发 生变 化 的 包 ， 这 可 以 
使 后 续 构建 更 快捷 。 为 了 方便 编译 依赖 的 包 ， go build -i 命令 将 安装 每 个 目标 所 依赖 的 包 


为 编译 对 应 不 同 的 操作 系统 平台 和 CPU 架 构 ，go install 命令 会 将 编译 结果 安装 到 GOOS 
和 GOARCH 对 应 的 目录 。 例 如 ， 在 Mac 系 统 ，golang.org/x/net/html 包 将 被 安装 到 
$GOPATH/pkg/darwin_amd64 目 录 下 的 golang.org/x/net/html.a 文 件 。 


针对 不 同 操作 系统 或 CPU 的 交叉 构建 也 是 很 简单 的 。 只 需要 设置 好 目标 对 应 的 GOOS 和 
GOARCH， 然 后 运行 构建 命令 即 可 。 下 面 交叉 编译 的 程序 将 输出 它 在 编译 时 操作 系统 和 CPU 


类 型 : 
gopl.io/ch10/cross 


func main() { 
fmt.Println(runtime.GOOS, runtime.GOARCH) 
} 


下 面 以 64 位 和 32 位 环境 分 别 执行 程序 : 


$ go build gopl.io/chi0/cross 

$ ./cross 

darwin amd64 

$ GOARCH=386 go build gopl.io/chi0/cross 
$ ./cross 

darwin 386 


包 可 能 需要 针对 不 同 平 台 和 处 理 器 类 型 使 用 不 同 版 本 的 代码 文件 ， 以 便于 处 理 底层 的 可 
隆 问 题 或 提供 为 一 些 特定 代码 提供 优化 。 如 果 一 个 文件 名 包含 了 一 个 操作 系统 或 处 理 器 
类 型 名 字 ， 例 如 net linux.go 或 asm_amd64.s，Go 语 言 的 构建 工具 将 只 在 对 应 的 平台 编译 这 
文件。 还 有 一 个 特别 的 构建 注释 注释 可 以 提供 更 多 的 构建 过 程控 制 。 例 如 ， 文 件 中 可 能 包 
人 下面 的 注释 : 


些 自 
移植 ， 


在 包 声 明和 和 包 注 释 的 前 面 ， 该 构建 注释 参数 告诉 go build 只 在 编译 程序 对 应 的 目标 操作 系统 
是 Linux 或 Mac OS X 时 才 编 译 这 个 文件 。 下 面 的 构建 注释 则 表示 不 编译 这 个 文件 : 


// +build ignore 


更 多 细节 ， 可 以 参考 go/build 包 的 构建 约束 部 分 的 文档 。 


$ go doc go/build 


10.7.4. 包 文 档 


Go 语言 的 编码 风格 鼓励 为 每 个 包 提供 良好 的 文档 。 包 中 每 个 导出 的 成 员 和 包 声 明 前 都 应 该 包 
念 目 的 和 用 法 说 明 的 注释 。 


Go 语言 中 包 文档 注释 一 般 是 完整 的 句子 ， 第 一 行 是 包 的 摘要 说 明 ， 注 释 后 仅 跟着 AP WI 
多 。 注 释 中 有 函数 的 参数 或 其 它 的 标识 符 并 不 需要 额外 的 引号 或 其 它 标 记 注 明 。 例 如 ， 下 面 是 
fmt.Fprintf 的 文档 注释 。 


// Fprintf formats according to a format specifier and writes to w. 
// It returns the number of bytes written and any write error encountered. 
func Fprintf(w io.Writer, format string, a ...interface{}) (int, error) 


Forint? 2748 RAK 09 20 Ff fmt & Lia P Rat ot RiERSRIRA LF We) > BizRate 
个 包 的 文档 。 包 文档 对 应 的 注释 只 能 有 一 个 〈 译 注 : 其 实 可 以 有 多 个 ， 它 们 会 组 合成 一 个 包 
文档 注释 ) ， 包 注释 可 以 出 现在 任何 一 个 源 文件 中 。 如 果 包 的 注释 内 容 比 较 长 ， 一 般 会 放 到 
一 个 独立 的 源 文件 中 ; fmt 包 注释 就 有 300 行 之 多 。 这 个 专门 用 于 保存 包 文档 的 源 文件 通常 叫 
doc.go ° 


好 的 文档 并 不 需要 面面俱到 ， 文 档 本 身 应 该 是 简洁 但 可 不 忽略 的 。 事 实 上 ，Go 语 言 的 风格 更 
喜欢 简洁 的 文档， 并 且 文 档 也 是 需要 像 代码 一 样 维护 的 。 对 于 一 组 声明 语句 ， 可 以 用 一 个 精 
炼 的 甸子 描 述 ， 如 果 是 显而易见 的 功能 则 并 不 需要 注释 。 

在 本 书 中 ， 只 要 空间 人 允许， 我们 之 前 很 多 包 声 明 都 包含 了 注释 文档 ， 但 你 可 以 从 标准 库 中 发 
现 很 多 更 好 的 例子 。 有 两 个 工具 可 以 帮 到 你 。 


首先 是 go doc 命令 ， 该 命令 打印 包 的 声明 和 每 个 成 员 的 文档 注释 ， 下 面 是 整个 包 的 文档 : 


$ go doc time 
package time // import "time" 


Package time provides functionality for measuring and displaying time. 


const Nanosecond Duration = 1 ... 
func After(d Duration) <-chan Time 
func Sleep(d Duration) 

func Since(t Time) Duration 

func Now() Time 

type Duration int64 

type Time struct { ... } 

...Many more... 


或 者 是 某 个 具体 包 成 员 的 注释 文档 : 


$ go doc time.Since 
func Since(t Time) Duration 


Since returns the time elapsed since t. 
It is shorthand for time.Now().Sub(t). 


或 者 是 菜 个 具体 包 的 一 个 方法 的 注释 文档 : 


$ go doc time.Duration.Seconds 
func (d Duration) Seconds() float64 


Seconds returns the duration as a floating-point number of seconds. 


该 命令 并 不 需要 输入 完整 的 包 导 入 路 径 或 正确 的 大 小 写 。 下 面 的 命令 将 打印 encoding/json 包 
的 (*json.Decoder).Decode 方法 的 文档 : 


$ go doc json.decode 
func (dec *Decoder) Decode(v interface{}) error 


Decode reads the next JSON-encoded value from its input and stores 
it in the value pointed to by v. 


第 二 个 工具 ， 名 字 也 叫 godoc， 它 提供 可 以 相互 交叉 引用 的 HTML 页 面 ， 但 是 包含 和 go 
doc 命令 相同 以 及 更 多 的 信息 。10.1 节 演示 了 time 包 的 文档 ，11.6 节 将 看 到 godoc 演 示 可 以 交 
互 的 示例 程序 。godoc 的 在 线 服务 https://godoc.org ， 和 包含 了 成 千 上 万 的 开源 包 的 检索 工具 。 


你 也 可 以 在 自己 的 工作 区 目录 运行 godoc 服 务 。 运 行 下 面 的 命令 ， 然 后 在 浏览 器 查看 
http://localhost:8000/pkg 页 面 : 


$ godoc -http :8000 


其 中 -analysis=type 和 -analysis=pointer 命令 行 标志 参数 用 于 打开 文档 和 代码 中 关于 静态 分 
析 的 结果 。 


10.7.5. 内 部 包 


在 Go 语音 程序 中 ， 包 的 封装 机 制 是 一 个 重要 的 特性 。 没 有 导出 的 标识 符 只 在 同一 个 包 内 部 可 
以 访问 ， 而 导出 的 标识 符 则 是 面向 全 宇宙 都 是 可 见 的 。 


We 
有 调用 者 都 可 见 。 例 如 ， 当 我 们 计划 将 一 个 大 的 包 拆 分 为 很 多 小 的 更 容易 维护 的 子 包 ， 但 是 
人 凡人， 人 有 
一 些 通 用 的 处 理 包 ， 或 者 我 们 只 是 想 实验 一 个 新 包 的 还 并 不 稳定 的 接口 ， 暂 时 只 暴露 给 一 些 
受 限 制 的 用 户 使 用 。 


[ST orn - ne Go Program: 


”有 golang.org’s 


Tne Go Programming rome SII 


Package time 


TTI 


import “time” 
arvow 


noex 
Examples 


Overview ~ 


Package time provides functionality for measuring and displaying time. 


The calendrical calculations always assume a Gregorian calendar 


Index + 
Constants 
func After{d Duration) <-chan Time 
func Steep(d Ouratior 
func Tickid Duration) <-chan Time 


type Duration 
func ParseDuration(s string) (Duration, error) 
func Sincelt Time) Ouration 
func (d Duration) Hours) fom64 
func (d Duration) Minutes() floaté4 
func (d Duration) Nanoseconds() int64 


Figure 10.1. The time package in godoc. 


为 了 满足 这 些 需求 ，Go 语 言 的 构建 工具 对 包含 internal 名 字 的 路 径 段 的 包 Gs 

包 叫 internal 包 ， 一 个 internal 包 只 能 被 和 internal 目 录 有 同一 个 父 目 录 的 包 所 导入 。 例 
如 ，net/http/internal/chunked 内 部 包 只 See ee 包 导 入 ， 但 是 不 能 被 
net/url 包 导入 。 不 过 net/url 包 却 可 以 导入 net/http/httputil 包 


net/http 
net/http/internal/chunked 
net/http/httputil 

net/url 


10.7.6. 查询 包 


go list 4P 命令 可 以 查询 可 用 包 的 信息 。 
的 导入 路 径 : 


$ go list github.com/go-sql-driver/mysql 
github.com/go-sql-driver/mysql 


go list 命令 的 参数 还 可 以 用 ",,." 表示 匹配 任意 的 包 的 导入 路 径 


作 区 中 的 所 有 包 


$ go list ... 
archive/tar 
archive/zip 
bufio 
bytes 
cmd/addr2line 
cmd/api 

. .Many more... 


或 者 是 特定 子 目 录 下 的 所 有 包 


$ go list gopl.io/ch3/... 
gopl.io/ch3/basename1 
gopl.io/ch3/basename2 
gopl.io/ch3/comma 
gopl.io/ch3/mandelbrot 
gopl.io/ch3/netflag 
gopl.io/ch3/printints 
gopl.io/ch3/surface 


或 者 是 和 某 个 主题 相关 的 所 有 包 


$ go list ...xml... 
encoding/xml 
gopl.io/ch7/xmlselect 


go list 命令 eas 个 包 完 整 的 元 信息 
不 同 格式 和 是 供给 G 其 中 -json 命令 行 


其 最 简单 的 形式 ， 可 以 测试 包 是 


否 在 工作 区 并 打印 它 


。 我 们 可 以 用 它 来 列表 工 


， 而 不 仅仅 只 是 导入 路 径 ， 


ere eae 


人 


了 每 个 


$ go list -json hash 
{ 
"Dir": "/home/gopher/go/src/hash", 
"ImportPath": "hash", 
"Name": "hash", 
"Doc": "Package hash provides interfaces for hash functions.", 
"Target": "/home/gopher/go/pkg/darwin_amd64/hash.a", 
"Goroot": true, 
"Standard": true, 
"Root": "/home/gopher/go", 
"GoFiles": [ 
"hash.go" 
], 
"Imports": [ 
"jo" 
], 
"Deps": [ 
"errors", 
"io", 
"runtime", 
"sync", 
"sync/atomic", 
"unsafe" 


命令 行 参数 -f 则 允许 用 户 使 用 text/template 包 (§4.6) 的 模板 语言 定义 输出 文本 的 格式 。 下 
面 的 命令 将 打 ie 的 依赖 的 包 ， 然 后 用 join 模板 函数 将 结果 链接 为 一 行 ， 连 接 时 每 个 结 
果 之 间 用 一 个 空格 分 


六 


$ go list -f '{{join .Deps " "}}' strconv 
errors math runtime unicode/utf8 unsafe 


译注 : 上 面 的 命令 在 Windows 的 命 
误 。 产 生 这 个 错误 的 原因 是 因为 命 
的 方法 解决 转 义 字符 串 的 问题 : 


行 运行 会 遇 到 template: main:1: unclosed action 的 错 


令 行 运 
令 行 对 命令 中 的 "" 参数 进行 了 转 义 处 理 。 可 以 按照 下 面 


$ go list -f "{{join .Deps \" \"}}" strconv 


下 面 的 命令 打印 compress 子 目录 下 所 有 包 的 依赖 包 列 表 : 


$ go list -f '{{.ImportPath}} -> {{join .Imports " "}}' compress/... 
compress/bzip2 -> bufio io sort 

compress/flate -> bufio fmt io math sort strconv 

compress/gzip -> bufio compress/flate errors fmt hash hash/crc32 io time 
compress/lzw -> bufio errors fmt io 

compress/zlib -> bufio compress/flate errors fmt hash hash/adler32 io 


译注 : Windows 下 有 同样 有 问题 ， 要 避免 转 义 字符 串 的 干扰 : 


$ go list -f "{{.ImportPath}} -> {{join .Imports \" \"}}" compress/... 


go list 命令 对 于 一 次 性 的 交互 式 查询 或 自动 化 构建 或 测试 脚本 都 很 有 帮助 。 我 们 将 在 11.2.4 
节 中 再 次 使 用 它 。 每 个 子 命令 的 更 多 信息 ， 包 括 可 设置 的 字段 和 意义 ， 可 以 用 go help 
list 命令 查看 。 


在 本 章 ， 我 们 解释 了 Go 语言 工具 中 除了 测试 命令 之 外 的 所 有 重要 的 子 命令 。 在 下 一 章 ， 我 们 
将 看 到 如 何 用 go test 命令 去 运行 Go 语言 程序 中 的 测试 代码 。 


练习 10.4 : 创建 一 个 工具 ， 根 据 命 令 行 指定 的 参数 ， 报 告 工作 区 所 有 依赖 指定 包 的 其 它 包 集 
合 。 提 示 : 你 需要 运行 go list 命令 两 次 ， 一 次 用 于 初始 化 包 ， 一 次 用 于 所 有 包 o 你 可 外 
要 用 encoding/json (§4.5) 包 来 分 析 输 出 的 JSON 格 式 的 信息 。 


第 十 一 章 测试 


Maurice Wilkes， 第 一 个 存储 程序 计算 机 EDSAC 的 设计 者 ，1949 年 他 在 实验 室 卜 楼梯 时 有 一 
个 顿悟 。 在 《计算 机 先驱 回忆 录 》 (Memoirs of a Computer Pioneer) 里 ， 他 回忆 到 :“ 忽 然 
间 有 一 种 醒 柄 灌顶 的 感觉 ， 我 整个 后 半生 的 美好 时 光 都 将 在 寻找 程序 BUG 中 度 过 了 ”。 肯 定 从 
那 之 后 的 大 部 分 正常 的 码 农 都 会 同情 Wilkes 过 份 慧 观 的 想法 ， 虽 然 也 许 不 是 没有 人 困惑 于 他 
对 软件 开发 的 难度 的 天 真 看 法 。 


现在 的 程序 已 经 远 比 Wilkes 时 代 的 更 大 也 更 复杂 ， 也 有 许多 技术 可 以 让 软件 的 复杂 性 可 得 到 
控制 。 其 中 有 两 种 技术 在 实践 中 证 明 是 比较 有 效 的 。 第 一 种 是 代码 在 被 正式 部 署 前 需要 进行 
代码 评审 。 第 二 种 则 是 测试 ， 也 就 是 本 章 的 讨论 主题 。 


我 们 说 测试 的 时 候 一 般 是 指 自动 化 测试 ， 也 就 是 写 一 些小 的 程序 用 来 检测 被 测试 代码 (产品 
代码 ) 的 行为 和 预期 的 一 样 ， 这 些 通常 都 是 精心 设计 的 执行 某 些 特定 的 功能 或 者 是 通过 随机 
性 的 输入 要 验证 边界 的 处 理 。 


软件 测试 是 一 个 巨大 的 领域 。 测 试 的 任务 可 能 已 经 占据 了 一 些 程 序 员 的 部 分 时 间 和 另 一 些 程 
序 员 的 全 部 时 间 。 和 软件 测试 技术 相关 的 图 书 或 博客 文章 有 成 千 上 万 之 多 。 对 于 每 一 种 主流 
的 编程 语言 ， 都 会 有 一 打 的 用 于 测试 的 软件 包 ， 同 时 也 有 大 量 的 测试 相关 的 理论 ， 而 且 每 种 
都 吸引 了 大 量 技术 先驱 和 追随 者 。 这 些 都 足以 说 服 那些 想 要 编写 有 效 测 试 的 程序 员 重 新 学 习 
一 套 全 新 的 技能 。 


Go 语言 的 测试 技术 是 相对 低级 的 。 它 依赖 一 个 go test 测 试 命令 和 一 组 按照 约定 方式 编写 的 测 
斌 函数， 测试 命令 可 以 运行 这 些 测试 函数 。 编 写 相 对 轻 量 级 的 纯 测试 代码 是 有 效 的 ， 而 且 它 
很 容易 延伸 到 基准 测试 和 示例 文档 。 


在 实践 中 ， 编 写 测试 代码 和 编写 程序 本 身 并 没有 多 大 区 别 。 我 们 编写 的 每 一 个 函数 也 是 针对 
每 个 具体 的 任务 。 我 们 必须 小 心 处 理 边 界 条 件 ， 思 考 合适 的 数据 结构 ， 推 断 合 适 的 输入 应 该 
产生 什么 样 的 结果 输出 。 编 程 测试 代码 和 编写 普通 的 Go 代码 过 程 是 类 似 的 ; 它 并 不 需要 学 习 
新 的 符号 、 规 则 和 工具 。 


11.1. go test 


go test 命 令 是 一 个 按照 一 定 的 约定 和 组 织 的 测试 代码 的 驱动 程序 。 在 包 目 录 内 ， 所 有 以 
_test.go 为 后 组 名 的 源 文 件 并 不 是 go build 构 建 包 的 一 部 分 ， 它 们 是 go test 测 试 的 一 部 分 。 


在 * test.go 文 件 中 ， 有 三 种 类 型 的 函数 : 测试 函数 、 基 准 测 试 函 数 、 示 例 函 数 。 一 个 测试 函 
数 是 以 Test 为 函数 名 前 级 的 函数 ， 用 于 测试 程序 的 一 些 逻 辑 行 为 是 否 正 确 go test 命 令 会 调用 
这 些 测 试 函 数 并 报告 测试 结果 是 PASS 或 FAIL。 基 准 测试 函数 是 以 Benchmark 为 函数 名 前 级 的 
函数 ， 它 们 用 于 衡量 一 些 函 数 的 性 能 ; go test 命 令 会 多 次 运行 基准 函数 以 计算 一 个 平均 的 执 
行 时 间 。 示 例 函 数 是 以 Example 为 函数 名 前 级 的 函数 ， 提 供 一 个 由 编译 器 保证 正确 性 的 示例 文 
档 。 我 们 将 在 11.2 节 讨论 测试 函数 的 所 有 细节 ， 病 在 11.4 节 讨论 基准 测试 函数 的 细节 ， 然 后 在 
11.6 节 讨论 示例 函数 的 细节 。 

go test 命 令 会 遍历 所 有 的 *_test.go 文 件 中 符合 上 述 命 名 规则 的 函数 ， 然 后 生成 一 个 临时 的 
main 包 用 于 调用 相应 的 测试 函数 ， 然 后 构建 并 运行 、 报 告 测试 结果 ， 最 后 清理 测试 中 生成 的 
临时 文件 。 


11.2. 测试 函数 
个 测试 函数 必须 导入 testing 包 。 测 试 函 数 有 如 下 的 签名 : 


func TestName(t *testing.T) { 
UN: 


测试 函数 的 名 字 必 须 以 Test 开 头 ， 可 选 的 后 级 名 必须 以 大 写字 母 开 头 : 


func TestSin(t *testing.T) { /* ... */ } 
func TestCos(t *testing.T) { /* ... */ } 
func TestLog(t *testing.T) { /* ... */ } 


其 中 tt 参数 用 于 报告 测试 失败 和 附加 的 日 志 人 信息。 让 我 们 定义 一 个 实例 包 gopl.io/ch11/word1 ° 

其 中 只 有 一 个 函数 lsPalindrome 用 于 检查 一 个 字符 串 是 否 从 前 向 后 和 从 后 向 前 读 都 是 一 样 的 。 
(下 面 这 个 实现 对 于 一 个 字符 串 是 否 是 回 文字 符 串 前 后 重复 测试 了 两 次 ; 我 们 稍 后 会 再 讨论 
这 个 问题 。) 


gopl.io/ch11/word1 


// Package word provides utilities for word games. 
package word 


// IsPalindrome reports whether s reads the same forward and backward. 
// (Our first attempt. ) 
func IsPalindrome(s string) bool { 
for i := range s { 
if s[i] != s[len(s)-1-i] { 
return false 


} 


return true 


在 相同 的 目录 下 ，word_test.go 测 试 文件 中 包含 了 TestPalindrome 和 TestNonPalindrome 两 个 
测试 函数 。 每 一 个 都 是 测试 lsPalindrome 是 否 给 出 正确 的 结果 ， 并 使 用 t.Error 报 告 失败 信息 : 


package word 
import "testing" 


func TestPalindrome(t *testing.T) { 
if !IsPalindrome("detartrated") { 
t.Error( IsPalindrome("detartrated") = false) 


} 
if !IsPalindrome("kayak") { 
t.Error( IsPalindrome("kayak") = false’) 


func TestNonPalindrome(t *testing.T) { 
if IsPalindrome("palindrome") { 
t.Error( IsPalindrome("palindrome") = true’) 


go test 命令 如 果 没 有 参数 指定 包 那 么 将 默认 采用 当前 目录 对 应 的 包 (和 go build 命令 一 
样 ) 。 我 们 可 以 用 下 面 的 命令 构建 和 运行 测试 。 


$ cd $GOPATH/src/gopl.io/chii/word1 
$ go test 
ok gopl.io/chii/word1 0.008s 


结果 还 比较 满意 ， 我 们 运行 了 这 个 程序 ， 不 过 没有 提前 退出 是 因为 还 没有 遇 到 BUG 报告 。 不 
过 一 个 法 国名 为 “Noelle Eve Elleon" 的 用 户 会 抱怨 lsPalindrome 函 数 不 能 识别 “6t6”。 另 外 一 个 
来 自 美国 中 部 用 户 的 抱怨 则 是 不 能 识别 “A man, a plan, a canal: Panama.”。 执 行 特殊 和 人 小 的 

BUG 报告 为 我 们 提供 了 新 的 更 自然 的 测试 用 例 。 


func TestFrenchPalindrome(t *testing.T) { 
if !IsPalindrome("éeté") { 


t.Error( IsPalindrome("été") = false’) 


func TestCanalPalindrome(t *testing.T) { 
input := "A man, a plan, a canal: Panama" 
if !IsPalindrome(input) { 
t.Errorf( IsPalindrome(%q) = false’, input) 


为 了 避免 两 次 输入 较 长 的 字符 串 ， 我 们 使 用 了 提供 了 有 类 似 Printf 格 式 化 功能 的 Error h žk% 
汇报 错误 ER j 


当 添 加 了 这 两 个 测试 用 例 之 后 ，go test 返回 了 测试 失败 的 信息 。 


$ go test 
--- FAIL: TestFrenchPalindrome (0.00s) 
word_test.go:28: IsPalindrome("été") = false 
--- FAIL: TestCanalPalindrome (0.00s) 
word_test.go:35: IsPalindrome("A man, a plan, a canal: Panama") = false 
FAIL 
FAIL gopl.io/chii/wordi 0.014s 


先 编写 测试 用 例 并 观察 到 测试 用 例 触 发 了 和 用 户 报告 的 错误 相同 的 描述 是 一 个 好 的 测试 习 
惯 。 只 有 这 样 ， 我 们 才能 定位 我 们 要 在 正解 决 的 问题 。 


先 写 测试 用 例 的 另外 的 好 处 是 ， 运 行 测试 通常 会 比 手 工 描 述 报告 的 处 理 更 快 ， 这 让 
进行 快速 地 和 迭代。 如 果 测 试 集 有 很 多 运行 缓慢 的 测试 ， 我 们 可 以 通过 只 选择 运行 某 
测试 来 加 快 测试 速度 


我 们 可 以 
些 特定 的 


参数 -v 可 用 于 打印 每 个 测试 函数 的 名 字 和 和 运行 时 间 : 


$ go test -v 

=== RUN TestPalindrome 

--- PASS: TestPalindrome (0.00s) 

=== RUN TestNonPalindrome 

--- PASS: TestNonPalindrome (0.00s) 

=== RUN TestFrenchPalindrome 

--- FAIL: TestFrenchPalindrome (0.00s) 
word_test.go:28: IsPalindrome("été") = false 

=== RUN TestCanalPalindrome 

--- FAIL: TestCanalPalindrome (0.00s) 
word_test.go:35: IsPalindrome("A man, a plan, a canal: Panama") = false 

FAIL 

exit status 1 

FAIL gopl.io/chii/wordi 0.017s 


参数 -run 对 应 一 个 正则 表达 式 ， 只 有 测试 函数 名 被 它 正 确 匹 配 的 测试 函数 才 会 被 go test M 
试 命令 运行 : 


$ go test -v -run="French|Canal" 
=== RUN TestFrenchPalindrome 
--- FAIL: TestFrenchPalindrome (0.00s) 
word_test.go:28: IsPalindrome("été") = false 
=== RUN TestCanalPalindrome 
--- FAIL: TestCanalPalindrome (0.00s) 
word_test.go:35: IsPalindrome("A man, a plan, a canal: Panama") = false 
FAIL 
exit status 1 
FAIL gopl.io/chii1/word1 0.014s 


当然 ， 一 旦 我 们 已 经 修复 了 失败 的 测试 用 例 ， 在 我 们 提交 代码 更 新 之 前 ， 我 们 应 该 以 不 带 参 
数 的 go test 命令 运行 全 部 的 测试 用 例 ， 以 确保 修复 失败 测试 的 同时 没有 引入 新 的 问题 。 


我 们 现在 的 任务 就 是 修复 这 些 错误 。 简 要 分 析 后 发 现 第 一 个 BUG 的 原因 是 我 们 采用 了 byte 而 
不 是 rune 序 列 ， 所 以 像 "6té” 中 的 6 等 非 ASCII 字 符 不 能 正确 处 理 。 第 二 个 BUG 是 因为 没有 忽略 
空格 和 字母 的 大 小 写 导 致 的 。 


针对 上 述 两 个 BUG， 我 们 仔细 重 写 了 有 函数 : 
opl.io/ch11/word2 


// Package word provides utilities for word games. 
package word 


import "unicode" 


// IsPalindrome reports whether s reads the same forward and backward. 
// Letter case is ignored, as are non-letters. 
func IsPalindrome(s string) bool { 
var letters []rune 
for _, r := range s { 
if unicode.IsLetter(r) { 
letters = append(letters, unicode.ToLower(r)) 


} 
} 
for i := range letters { 
if letters[i] != letters[len(letters)-1i-i] { 
return false 
} 
} 


return true 


同时 我 们 也 将 之 前 的 所 有 测试 数据 合并 到 了 一 个 测试 中 的 表格 中 。 


func TestIsPalindrome(t *testing.T) { 
var tests = []struct { 
input string 
want bool 


Ji 
ed 
Ta truer, 
{"aa", true}, 
{"ab", false}, 
{"kayak", true}, 
(detarEraced cuey 
{"A man, a plan, a canal: Panama", true}, 
HEV dr dwell slewd (dad Taveni ENUEI, 
{"Able was I ere I saw Elba", true}, 
{"été", true}, 
‘Et Senresservi Ivresse restec a tuUe 
{"palindrome", false}, // non-palindrome 
dessermes falser, // semi-palindrome 
} 
for _, test := range tests { 
if got := IsPalindrome(test.input); got != test.want { 
t.Errorf("IsPalindrome(%q) = %v", test.input, got) 
} 
} 


现在 我 们 的 新 测试 阿 都 通过 了 : 


$ go test gopl.io/chii/word2 
ok gopl.io/chi1/word2 0.015s 


这 种 表格 驱动 的 测试 在 Go 语言 中 很 常见 的 。 我 们 很 容易 向 表格 添加 新 的 测试 数据 ， 并 且 后 面 
的 测试 逻辑 也 没有 宛 余 ， 这 样 我 们 可 以 有 更 多 的 精力 地 完善 错误 信息 。 


失败 测试 的 输出 并 不 包括 调用 t.Errorf 时 刻 的 堆栈 调用 信息 。 和 其 他 编程 语言 或 测试 框架 的 
assert 断 言 不 同 ，t.Errorf 调 用 也 没有 引起 panic 异 常 或 停止 测试 的 执行 。 即 使 表格 中 前 面 的 数 
据 导 致 了 测试 的 失败 ， 表 格 后 面 的 测试 数据 依然 会 运行 测试 ， 因 此 在 一 个 测试 中 我 们 可 能 
解 多 个 失败 的 信息 。 


如 果 我 们 在 的 需要 停止 测试 ， 或 许 是 因为 初始 化 失败 或 可 能 是 早先 的 错误 导致 了 后 续 错误 等 
原因 ， 我 们 可 以 使 用 t.Fatal 或 t.Fatalf 停 止 当 前 测试 函数 。 它 们 必须 在 和 测试 函数 同一 个 
goroutine 内 调用 。 


测试 失败 的 信息 一 般 的 形式 是 “f(x) = y, want z”， 其 中 f(x) 解 释 了 失败 的 操作 和 对 应 的 输出 ，y 


是 实际 的 运行 结果 ，ZzZ 是 期 望 的 正确 的 结果 。 就 像 前 面 检 查 回 文字 符 串 的 例子 ， 实 际 的 函数 用 
于 f(X) 部 分 。 如 果 显 示 X 是 表格 驱动 型 测试 中 比较 重要 的 部 分 ， 因 为 同一 个 断言 可 能 对 应 不 同 


的 表格 项 执行 多 次 。 要 避免 无 用 和 宛 余 的 信息 。 在 测试 类 似 IsPalindrome 返 回 布尔 类 型 的 函数 
时 ， 可 以 忽略 并 没有 额外 信息 的 z 部 分 。 如 果 X、y 或 z 是 y 的 长 度 ， 输 出 一 个 相关 部 分 的 简明 总 
结 即 可 。 测 试 的 作者 应 该 要 努力 帮助 程序 员 诊 断 测试 失败 的 原因 。 

练习 11.1: 为 4.3 节 中 的 charcount 程 序 编写 测试 。 


练习 11.2: A (§6.5) 的 IntSet 编 写 一 组 测试 ， 用 于 检查 每 个 操作 后 的 行为 和 基于 内 置 map 的 
集合 等 价 ， 后 面 练习 11.7 将 会 用 到 。 


11.2.1. 随机 测试 


表格 驱动 的 测试 便于 构造 基于 精心 挑选 的 测试 数据 的 测试 用 例 。 另 一 种 测试 思路 是 随机 测 
试 ， 也 就 是 通过 构造 更 广泛 的 随机 输入 来 测试 探索 函数 的 行为 。 

那么 对 于 一 个 随机 的 输入 ， 我 们 如 何 能 知道 希望 的 输出 结果 呢 ? 这 里 有 两 种 处 理 策略 。 第 一 
个 是 编写 另 一 个 对 照 函 数 ， 使 用 简单 和 清晰 的 站 法 ， 虽 然 效 率 较 低 但 是 行为 和 要 测试 的 有 子 数 
是 一 致 的 ， 然 后 针对 相同 的 随机 输入 检查 两 者 的 输出 结果 。 第 二 种 是 生成 的 随机 输入 的 数据 
遵循 特定 的 模式 ， 这 样 我 们 就 可 以 知道 期 望 的 输出 的 模式 。 


下 面 的 例子 使 用 的 是 第 二 种 方法 : randomPalindrome 郊 数 用 于 随机 生成 回 文字 符 事 。 


import "math/rand" 


// randomPalindrome returns a palindrome whose length and contents 
// are derived from the pseudo-random number generator rng. 
func randomPalindrome(rng *rand.Rand) string { 


n := rng.Intn(25) // random length up to 24 
runes := make([]rune, n) 
TRON al, s= (OR) ak (nr 


r := rune(rng.Intn(0x1000)) // random rune up to '\u0999' 
runes[i] =r 
runes[n-1-i] = r 


} 


return string(runes) 


func TestRandomPalindromes(t *testing.T) { 
// Initialize a pseudo-random number generator. 
seed := time.Now().UTC().UnixNano() 
t.Logf("Random seed: %d", seed) 
rng := rand.New(rand.NewSource(seed)) 


for i := 0; i < 1000; Itr 1 
p := randomPalindrome(rng) 
if !IsPalindrome(p) { 
t.Errorf("IsPalindrome(%q) = false", p) 


虽然 随机 测试 会 有 不 确定 因素 ， 但 是 它 也 是 至 关 重 要 的 ， 我 们 可 以 从 失败 测试 的 日 志 获 取 足 
够 的 信息 。 在 我 们 的 例子 中 ， 输 入 lsPalindrome 的 p 参 数 将 告诉 我 们 站 实 的 数据 ， 但 是 对 于 部 
数 将 接受 更 复杂 的 输入 ， 不 需要 保存 所 有 的 输入 ， 只 要 日 志 中 简单 地 记录 随机 数 种 子 即 可 
( 像 上 面 的 方式 ) 。 有 了 这 些 随 机 数 初始 化 种 子 ， 我 们 可 以 很 容易 修改 测试 代码 以 重 现 失败 
的 随机 测试 。 


通过 使 用 当前 时 间作 为 随机 种 子 ， 在 整个 过 程 中 的 每 次 运行 测试 命令 时 都 将 探索 新 的 随机 数 
据 。 如 果 你 使 用 的 是 定期 运行 的 自动 化 测试 集成 系统 ， 随 机 测试 将 特别 有 价值 。 


练习 11.3: TestRandomPalindromes 测 试 函 数 只 测试 了 回 文字 符 串 。 编 写 新 的 随机 测试 生成 
器 ， 用 于 测试 随机 生成 的 非 回 文字 符 串 。 


练习 11.4: 修改 randomPalindrome 函 数 ， 以 探索 IsPalindrome 是 否 对 标点 和 空格 做 了 正确 处 
理 。 


11.2.2. 测试 一 个 命令 


对 于 测试 包 go test 是 一 个 的 有 用 的 工具 ， 但 是 稍 加 努力 我 们 也 可 以 用 它 来 测试 可 执行 程 
序 。 如 果 一 个 包 的 名 字 是 main， 那 么 在 构建 时 会 生成 一 个 可 执行 程序 ， 不 过 main 包 可 以 作为 
一 个 包 被 测试 器 代码 导入 。 

让 我 们 为 2.3.2 节 的 echo 程 序 编写 一 个 测试 。 我 们 先 将 程序 拆 分 为 两 个 函数 : echo ZRA 
正 的 工作 > main $% 4/4 于 处 理 命令 行 输入 参数 和 echo 可 能 返回 的 错误 5 


gopl.io/ch11/echo 


// Echo prints its command-line arguments. 


package main 


import ( 
"Flag" 
"Fmt" 
Nao" 
"os" 
eStmeingsi: 
) 
var ( 
n = flag.Bool("n", false, "omit trailing newline") 


s = flag.String("s", " ", "separator") 


var out io.Writer = os.Stdout // modified during testing 


func main() { 
flag.Parse() 


if err := echo(!*n, *s, flag.Args()); err != nil { 
fmt.Fprintf(os.Stderr, "echo: %v\n", err) 
os.Exit(1) 

} 


} 


func echo(newline bool, sep string, args []string) error { 
fmt.Fprint(out, strings.Join(args, sep) ) 
if newline { 
fmt.Fprintln(out) 
} 


return nil 


在 测试 中 我 们 可 以 用 各 种 参数 和 标 标 志 调 用 echo 函 数 ， 然 后 检测 它 的 输出 是 否 正 确 , 我 们 通过 
增加 参数 来 减少 echo 函 数 对 全 局 变量 的 依赖 。 我 们 还 增加 了 一 个 全 局 名 为 out 的 变量 来 替代 直 
接 使 用 os.Stdout， 这 样 测试 代码 可 以 根据 需要 将 out 修 改 为 不 同 的 对 象 以 便于 检查 。 下 面 就 是 
echo_test.go 文 件 中 的 测试 代码 : 


package main 


import ( 
"bytes" 
fme 
"testing" 
) 


func TestEcho(t *testing.T) { 
var tests = []struct { 
newline bool 


sep string 
args []string 
want string 
Ji 
Cees, Ui SEN 
{false, "", []string{}, ""}, 
{true NE fisting one. “two, three “oneNtEewoNtEhneeNni}, 
sei Ua Ee a Nn 
SC MB SL egal, MA Mee Malate 
} 
for _, test := range tests { 
descr := fmt.Sprintf("echo(%v, %q, %q)", 
test.newline, test.sep, test.args) 
out = new(bytes.Buffer) // captured output 
if err := echo(test.newline, test.sep, test.args); err != nil { 
t.Errorf("%s failed: %v", descr, err) 
continue 
} 
got := out.(*bytes.Buffer).String() 
if got != test.want { 
t.Errorf("%s = %q, want %q", descr, got, test.want) 
} 
} 


要 注意 的 是 测试 代码 和 产品 代码 在 同一 个 包 。 虽 然 是 main 包 ， 也 有 对 应 的 main 入 口 函 数 ， 但 
是 在 测试 的 时 候 main 包 只 是 TestEcho 测 试 函 数 导 入 的 一 个 普通 包 ， 里 面 main 遂 数 并 没有 被 导 
出 ， 而 是 被 忽略 的 。 


通过 将 测试 放 到 表格 中 ， 我 们 很 容易 添加 新 的 测试 用 例 。 让 我 通过 增加 下 面 的 测试 用 例 来 看 
看 失败 的 情况 是 怎么 样 的 : 


{true, ",", []string{"a", “b", "“c"}, “a b c\n"}, // NOTE: wrong expectation! 


go test 输出 如 下 : 


$ go test gopl.io/chi1/echo 
- FAIL: TestEcho (0.00s) 


echo_test.go:31: echo(true, ",", ["a" "b" "c"]) = "a,b,c", want "a b c\n" 
FAIL 
FAIL gopl.io/chii/echo ©.006s 
错误 信息 peau, (使 用 Go 类 似 语 法 ) ， 实 际 的 结果 和 期 望 的 结果 。 这 样 的 错 


误 信息 ， 你 可 以 在 检视 代码 之 前 就 很 容易 定位 错误 的 原因 。 


要 注意 的 是 在 测试 代码 中 并 没有 调用 log.Fatal 或 os.Exit， 因 为 调用 这 类 函数 会 导致 程序 提前 退 
调用 这 些 函 数 的 特权 应 该 放 在 main 函 数 中 。 如 果 的 有 意外 的 事情 导致 函数 发 生 panic 红 
， 测 试 驱动 应 该 党 试用 recover 捕 获 异 常 ， 然 后 将 当前 测试 当 作 失败 处 理 。 如 果 是 可 预期 的 
， 例如 非法 的 用 户 输入 、 找 不 到 文件 或 配置 文件 不 当 等 应 该 通过 返回 一 个 非 空 的 error 的 
方式 处 理 。 幸 运 的 是 《上 面 的 意外 只 是 一 个 插曲 ) ， 我 们 的 echo 示 例 是 比较 简单 的 也 没有 需 
要 返回 非 空 error 的 情况 。 


11.2.3. 白金 测试 


一 种 测试 分 类 的 方法 是 基于 测试 者 是 否 需要 了 解 被 测试 对 象 的 内 部 工作 原理 。 黑 盒 测 试 只 需 
要 测试 包公 开 的 文档 和 API 行 为 ， 内 部 实现 对 测试 代码 是 透明 的 。 相 反 ， 白 盒 测 试 有 访问 包 内 
部 函数 和 数据 结构 的 权限 ， 因 此 可 以 做 到 一 下 普通 客户 端 无 法 实现 的 测试 。 例 如 ， 一 个 白金 
测试 可 以 在 每 个 操作 之 后 检测 不 变量 的 数据 类 型 。 (白金 测 试 只 是 一 个 传统 的 名 称 ， 其 实 称 
为 clear box 测 试 会 更 准确 。) 


黑 盒 和 白 盒 这 两 种 测试 方法 是 互补 的 。 黑 盒 测 试 一 般 更 健 半 ， 随 着 软件 实现 的 完善 测试 代码 
很 少 需要 更 新 。 它 们 可 以 帮助 测试 者 了 解 真 是 客户 的 需求 ， 也 可 以 帮助 发 现 API 设 计 的 一 些 不 
足 之 处 。 相 反 ， 白 盒 测 试 则 可 以 对 内 部 一 些 坏 手 的 实现 提供 更 多 的 测试 覆盖 。 


我 们 已 经 看 到 两 种 测试 的 例子 。TestlsPalindrome 测 试 仅 仅 使 用 导出 的 lsPalindrome 有 函数 ， 
此 这 是 一 个 黑 盒 测试 。TestEcho 测 试 则 调用 了 内 部 的 echo 函 数 ， 并 且 更 新 了 内 部 的 out 包 级 变 
这 两 个 都 是 未 导出 的 ， 因 此 这 是 白 盒 测试 。 


当 我 们 准备 TestEcho 测 试 的 时 候 ， 我 们 修改 了 echo 函 数 使 用 包 级 的 out 变 量 作为 输出 对 象 ， 因 
此 测试 代码 可 以 用 另 一 个 实现 代替 标准 输出 ， 这 样 可 以 方便 对 比 echo 输 出 的 数据 。 使 用 类 似 
的 技术 ， 我 们 可 以 将 产品 代码 的 其 他 部 分 也 替换 为 一 个 容易 测试 的 伪 对 象 。 使 用 伪 对 象 的 好 
处 是 我 们 可 以 方便 配置 ， 容 易 预测 ， 更 可 靠 ， 也 更 容易 观察 。 同 时 也 可 以 避免 一 些 不 良 的 副 
作用 ， 例 如 更 新 生产 数据 库 或 信用 卡 消费 行为 。 


下 面 的 代码 演示 了 为 用 户 提 供 网 络 存 储 的 web 服 务 中 的 配额 检测 逻辑 。 当 用 户 使 用 了 超过 90% 
的 存储 配额 之 后 将 发 送 提醒 邮件 。 


gopl.io/ch11/storage1 


package storage 


import ( 
Mee 
SLOGH 
"net/smtp" 


func bytesInUse(username string) int64 { return 0 /* ... */ } 


// Email sender configuration. 
// NOTE: never put passwords in source code! 


const sender = "notifications@example.com" 

const password = "correcthorsebatterystaple" 

const hostname = "smtp.example.com" 

const template = “Warning: you are using %d bytes of storage, 


%d%% Of your quota. ` 


func CheckQuota(username string) { 
used := bytesInUse(username) 
const quota = 1000000000 // 1GB 
percent := 100 * used / quota 
if percent < 90 { 
return // OK 


} 

msg := fmt.Sprintf(template, used, percent) 

auth := smtp.PlainAuth("", sender, password, hostname) 
err := smtp.SendMail(hostname+":587", auth, sender, 


[]string{username}, []byte(msg) ) 
if err != nil { 
log.Printf("smtp.SendMail(%s) failed: %s", username, err) 


ANT AL MY RS AAG > ALAN HR a RX E EMBA o Al BEAR AT AS Op Hy Ab HE BH Hy By] — 
个 私有 的 notifyUser 函 数 中 。 


gopl.io/ch11/storage2 


var notifyUser = func(username, msg string) { 
auth := smtp.PlainAuth("", sender, password, hostname) 
err := smtp.SendMail(hostname+":587", auth, sender, 
[]stringf{username}, []byte(msg) ) 
if err != nil { 


log.Printf("smtp.SendEmail(%s) failed: %s", username, err) 


func CheckQuota(username string) { 
used := bytesInUse(username) 
const quota = 1000000000 // 1GB 
percent := 100 * used / quota 
if percent < 90 { 
return // OK 
} 
msg := fmt.Sprintf(template, used, percent) 
notifyUser(username, msg) 


HERMT AE RNR P A O OB RK BBA AK HY OB RIK HA o 


的 用 户 和 邮件 的 内 容 。 


它 只 是 简单 记录 要 通知 


package storage 


import ( 
"strings" 
"testing" 
) 


func TestCheckQuotaNotifiesUser(t *testing.T) { 
var notifiedUser, notifiedMsg string 
notifyUser = func(user, msg string) { 
notifiedUser, notifiedMsg = user, msg 


// ...Simulate a 980MB-used condition... 


const user = "joe@example.org" 
CheckQuota(user ) 
if notifiedUser == "" && notifiedMsg == "" { 
t.Fatalf("notifyUser not called") 
} 
if notifiedUser != user { 
t.Errorf("wrong user (%s) notified, want %s", 
notifiedUser, user) 
} 
const wantSubstring = "98% of your quota" 
if !strings.Contains(notifiedMsg, wantSubstring) { 
t.Errorf("unexpected notification message <<%s>>, "+ 
"want substring %q", notifiedMsg, wantSubstring) 


这 里 有 一 个 问题 : 当 测试 函数 返回 后 ，CheckQuota 将 不 能 正常 工作 ， 因 为 notifyUsers 依 然 使 
用 的 是 测试 函数 的 伪 发 送 邮件 函数 〈 当 更 新 全 局 对 象 的 时 候 总 会 有 这 种 风险 ) 。 我 们 必须 修 
改 测 试 代 码 恢复 notifyUsers 原 先 的 状态 以 便 后 续 其 他 的 测试 没有 影响 ， 要 确保 所 有 的 执行 路 
径 后 都 能 恢复 ， 包 括 测试 失败 或 Danic 异 常 的 情形 。 在 这 种 情况 下 ， 我 们 建议 使 用 defer 语 句 来 
延 后 执行 处 理 恢复 的 代码 。 


func TestCheckQuotaNotifiesUser(t *testing.T) { 
// Save and restore original notifyUser. 
saved := notifyUser 
defer func() { notifyUser = saved }() 


// Install the test's fake notifyUser. 

var notifiedUser, notifiedMsg string 

notifyUser = func(user, msg string) { 
notifiedUser, notifiedMsg = user, msg 


} 
fi / rest of CESE e 


这 种 处 理 模 式 可 以 用 来 暂时 保存 和 恢复 所 有 的 全 局 变量 ， 包 括 命令 行 标志 参数 、 调 试 选项 和 
优化 参数 ; 安装 和 移 除 导致 生产 代码 产生 一 些 调试 信息 的 钩子 函数 ; 还 有 有 些 诱 导 生 产 代 码 
进入 某 些 重要 状态 的 改变 ， 比 如 超时 、 错 误 ， 其 至 是 一 些 刻意 制造 的 并 发 行为 等 因素 。 


以 这 种 方式 使 用 全 局 变量 是 安全 的 ， 因 为 go test 命 令 并 不 会 同时 并 发 地 执行 多 个 测试 。 


11.2.4. 扩展 测试 包 


考虑 下 这 两 个 包 : net/url 包 ， 提 供 了 URL 解 析 的 功能 net/http 包 ， 提 供 了 web 服 务 和 HTTP 客 
户 端的 功能 。 如 我 们 所 料 ， 上 层 的 net/http 包 依赖 下 层 的 net/url 包 。 然 后 ，net/url 包 中 的 一 个 测 
试 是 演示 不 同 URL 和 HTTP 客 户 端的 交互 行为 。 也 就 是 说 ， 一 个 下 层 包 的 测试 代码 导入 了 上 层 
的 包 。 


net/http 





net/url 


Figure 11.1. A test of net/ur1 depends on net/http. 


这 样 的 行为 在 net/url 包 的 测试 代码 中 会 导致 包 的 循环 依赖 ， 正 如 图 11.1 中 向 上 箭头 所 示 ， 同 时 
正如 我 们 在 10.1 节 所 讲 的 ，Go 语 言 规范 是 禁止 包 的 循环 依赖 的 。 


不 过 我 们 可 以 通过 测试 扩展 包 的 方式 解决 循环 依赖 的 问题 ， 也 就 是 在 net/url 包 所 在 的 目录 声明 
一 个 独立 的 url_test 测 试 扩 展 包 。 其 中 测试 扩展 包 名 的 test 后 组 告诉 go test 工 具 它 应 该 建立 
一 个 额外 的 包 来 运行 测试 。 我 们 将 这 个 扩展 测试 包 的 导入 路 径 视 作 是 net/url_test 会 更 容易 理 
解 ， 但 实际 上 它 并 不 能 被 其 他 任何 包 导 入 。 


因为 测试 扩展 包 是 一 个 独立 的 包 ， 所 以 可 以 导入 测试 代码 依赖 的 其 他 的 辅助 包 ; 包 内 的 测试 
代码 可 能 无 法 做 到 。 在 设计 层面 ， 测试 扩展 包 是 在 所 以 它 依赖 的 包 的 上 层 ， 正 如 图 11.2 所 示 。 


net/url_test 
net/http 


Figure 11.2. External test packages break dependency cycles. 


通过 回避 循环 导入 依赖 ， 扩 展 测 试 包 可 以 更 灵活 的 编写 测试 ， 特 别 是 集成 测试 (需要 测试 多 
个 组 件 之 间 的 交互 ) ， 可 以 像 普通 应 用 程序 那样 自由 地 导入 其 他 包 。 


我 们 可 以 用 go list 命 令 查看 包 对 应 目录 中 哪些 Go 源 文件 是 产品 代码 ， 哪 些 是 包 内 测试 ， 还 哪 
些 测试 扩展 包 。 我 们 以 fmt 包 作为 一 个 例子 : GoFiles 表 示 产 品 代 码 对 应 的 Go 源 文件 列表 ; 也 
就 是 go build 命 令 要 编译 的 部 分 


$ go list -f={{.GoFiles}} fmt 
[doc.go format.go print.go scan.go] 


TestGoFiles 表 示 的 是 fmt 包 内 部 测试 测试 代码 ， 以 _test.go 为 后 组 文件 名 ， 不 过 只 在 测试 时 被 
构建 : 


$ go list -f={{.TestGoFiles}} fmt 
[export_test.go] 


包 的 测试 代码 通常 都 在 这 些 文 件 中 ， 不 过 fmt 包 并 非 如 此 ; 稍 后 我 们 再 解释 export_ test.go 文 件 
的 作用 。 


XTestGoFiles 表 示 的 是 属于 测试 扩展 包 的 测试 代码 ， 也 就 是 fmt test 包 ， 因 此 它们 必须 先导 入 
fmt 包 。 同 样 ， 这 些 文件 也 只 是 在 测试 时 被 构建 运行 


$ go list -f={{.XTestGoFiles}} fmt 
[fmt_test.go scan_test.go stringer_test.go] 


有 时 候 测 试 扩 展 包 也 需要 访问 被 测试 包 内 部 的 代码 ， 例 如 在 一 个 为 了 避免 循环 导入 而 被 独立 
到 外 部 测试 扩展 包 的 和 白 盒 测试 。 在 这 种 情况 下 ， ee ules 我 们 在 包 内 的 
一 个 test.go 文 件 中 导出 一 个 内 部 的 实现 给 测试 扩展 包 这 些 代码 只 有 在 测试 时 才 需 要 ， 
因此 一 般 会 放 在 export test.go 文 件 中 。 


例如 ，fmt 包 的 fmt.Scanf 函 数 需要 unicode.lsSpace 兄 数 提供 的 功能 。 但 是 为 了 避免 太 多 的 依 
赖 ，fmt 包 并 没有 导入 包含 巨大 表格 数据 的 unicode 包 ; 相反 fmt 包 有 一 个 叫 jsSpace 内 部 的 简 多 
实现 。 


为 了 确保 fmt.isSpace 和 unicode.lsSpace 遂 数 的 行为 一 致 ，fmt 包 谨 懂 地 包含 了 一 个 测试 。 是 
一 个 在 测试 扩展 包 内 的 和 白 盒 测试 ， 是 无 法 直接 访问 到 jsSSpace 内 部 函数 的 ， 因 此 fmt 通 过 一 
秘密 出 口 导 出 了 isSpace 有 函数 。export_test.go 文 件 就 是 专门 用 于 测试 扩展 包 的 秘密 出 口 。 


package fmt 


var IsSpace = isSpace 


TAAT EEN 试 代码 ; 它 只 是 通过 fmt.lsSpace 简 单 导 出 了 内 部 的 isSSpace 有 函数， 
se eee 广泛 用 于 位 于 测试 扩展 包 的 和 白 盒 测 试 。 


11.2.5. 编写 有 效 的 测试 


许多 Go 语言 新 人 会 惊异 于 它 的 极 简 的 测试 框架 。 很 多 其 它 语言 的 测试 框架 都 提供 了 识别 测试 
函数 的 机 制 (通常 使 用 反射 或 元 数据 ) ， 通 过 设置 一 些 ‘setup” 和 “teardown” 的 钓 子 函数 来 执行 
测试 用 例 运 行 的 初始 化 和 之 后 的 清理 操作 ， 同 时 测试 工具 箱 还 提供 了 很 多 类 似 assert 断 言 ， 值 
比较 函数 ， 格 式 化 输出 错误 信息 和 停止 一 个 识别 的 测试 等 辅助 函数 (通常 使 用 异常 机 制 ) 。 
虽然 这 些 机 制 可 以 使 得 测试 非常 简洁 ， 但 是 测试 输出 的 日 志 却 会 像 火 星 文 一 般 难 以 理解 。 此 
外 ， 虽 然 测 试 最 终 也 会 输出 PASS 或 FAIL 的 报告 ， 但 是 它们 提供 的 信息 格式 却 非常 不 利于 代码 
维护 者 快速 定位 问题 ， 因 为 失败 的 信息 的 具体 含义 是 非常 隐 上 的 ， 比 如 "assert: 0 == 1 或 成 页 
的 海量 跟踪 日 志 。 


Go 语言 的 测试 风格 则 形成 鲜明 对 比 。 它 期 望 测试 者 自己 完成 大 部 分 的 工作 ， 定 义 函 数 避 免 重 
复 ， 就 像 普通 编程 那样 。 编 写 测试 并 不 是 一 个 机 械 的 填空 过 程 ; 一 个 测试 也 有 自 网 ， 

尽管 它 的 维护 者 也 是 测试 仅 有 的 一 个 用 户 。 一 个 好 的 测试 不 应 该 引发 其 他 无 关 的 错误 信 
青 晰 简洁 地 描述 问题 的 症状 即 可 ， 有 时 候 可 能 还 需要 一 些 上 下 文 信息 。 在 理想 Ht 

， 维 护 者 可 以 在 不 看 代码 的 情况 下 就 能 根据 错误 信息 定位 错误 产生 的 原因 。 _ 
ee ee i ， 因 为 
我 们 可 能 从 多 个 失败 测试 的 模式 中 发 现 错误 产生 的 规律 。 


下 面 的 断言 函数 比较 两 个 值 ， 然 后 生成 一 个 通用 的 错误 信息 ， 并 停止 程序 。 它 很 方便 使 用 也 
确实 有 效果 ， 但 是 当 测 试 失败 的 时 候 ， 打 印 的 错误 信息 却 几 乎 是 没有 价值 的 。 它 并 没有 为 快 
速 解决 问题 提供 一 个 很 好 的 入 口 。 


import ( 
"Eme" 
tstrings™ 
testunge 
) 
// A poor assertion function. 


func assertEqual(x, y int) { 


if x != yt{ 
panic(fmt.Sprintf("%d != %d", x, y)) 
} 
} 
func TestSplit(t *testing.T) { 
words := strings.Split("a:b:c", ":") 
assertEqual(len(words), 3) 
Tih er 
} 


从 这 个 意义 上 说 ， Meee 过 早 抽 象 的 错误 : 仅仅 测试 两 个 整数 是 否 相 同 ， 而 放弃 了 根 
据 上 下 文 提供 更 有 意义 的 错误 信息 的 做 法 。 我 们 可 以 根据 具体 的 错误 打印 一 个 更 有 价值 的 错 
误 信 息 ， 就 像 下 面 例子 那样 。 测 ieee eee ° 


func TestSplit(t *testing.T) { 
Sp Sep) f= ta DC May 
words := strings.Split(s, sep) 
if got, want := len(words), 3; got != want { 
t.Errorf("Split(%q, %q) returned %d words, want %d", 
s, sep, got, want) 


现在 的 测试 不 仅 报告 了 调用 的 具体 函数 、 它 的 输入 和 结果 的 意义 ;并且 打印 的 丨 实 返 回 的 值 
和 期 望 返回 的 值 ; 并 且 即 使 断言 失败 依然 会 继续 尝试 运行 更 多 的 测试 。 一 旦 我 们 写 了 这 样 结 
构 的 测试 ， 下 一 步 自 然 不 是 用 更 多 的 if 语 句 来 扩展 测试 用 例 ， 我 们 可 以 用 像 lIsPalindrome 的 表 
驱动 测试 那样 来 准备 更 多 的 S 和 sep 测 试用 例 。 


前 面 的 例子 并 不 需要 额外 的 辅助 函数 ， 如 果 有 可 以 使 测试 代码 更 简单 的 方法 我 们 也 乐意 接 
Ho (我 们 将 在 13.3 节 看 到 一 个 类 似 reflect.DeepEqual 辅 助 函 数 。) 开始 一 个 好 的 测试 的 关键 
是 通过 实现 你 丨 正 想 要 的 具体 行为 ， 然 后 才 是 考虑 然后 简化 测试 代码 。 最 好 的 接口 是 直接 从 
库 的 抽象 接口 开始 ， 针 对 公共 接口 编写 一 些 测试 函数 。 


练习 11.5: 用 表格 驱动 的 技术 扩展 TestSplit 测 试 ， 并 打印 期 望 的 输出 结果 。 


11.2.6. 避免 的 不 稳定 的 测试 


如 果 一 个 应 用 程序 对 于 新 出 现 的 但 有 效 的 输入 经 常 失败 说 明 程序 不 够 稳健 ; 同样 如 果 一 个 测 
试 仅仅 因为 声音 变化 就 会 导致 失败 也 是 不 合 逻 辑 的 。 就 像 一 个 不 够 稳健 的 程序 会 挫败 它 的 用 
户 一 样 ， 一 个 脆弱 性 测试 同样 会 激怒 它 的 维护 者 。 最 脆弱 的 测试 代码 会 在 程序 没有 任何 变化 
的 时 候 产 生 不 同 的 结果 ， 时 好 时 坏 ， 处 理 它们 会 耗费 大 量 的 时 间 但 是 并 不 会 得 到 任何 好 处 。 


当 一 个 测试 函数 产生 一 个 复杂 的 输出 如 一 个 很 长 的 字符 串 ， 或 一 个 精心 设计 的 数据 结构 或 一 
个 文件 ， 它 可 以 用 于 和 预 设 的 “golden” 结 果 数 据 对 比 ， 用 这 种 简单 方式 写 测试 是 请 人 的 。 但 是 
随 着 项 目的 发 展 ， 输 出 的 某 些 部 分 很 可 能 会 发 生变 化 ， 尽 管 很 可 能 是 一 个 改进 的 实现 导致 

的 。 而 且 不 仅仅 是 输出 部 分 ， 函 数 复 杂 复 制 的 输入 部 分 可 能 也 跟着 变化 了 ， 因 此 测试 使 用 的 
输入 也 就 不 在 有 效 了 。 


避免 脆弱 测试 代码 的 方法 是 只 检测 你 丨 正 关 心 的 属性 。 保 持 测试 代码 的 简洁 和 内 部 结构 的 稳 
定 。 特 别 是 对 断言 部 分 要 有 所 选择 。 不 要 检查 字符 串 的 全 匹配 ， 但 是 寻找 相关 的 子 字符 串 ， 
因为 某 些 子 字符 串 在 项 目的 发 展 中 是 比较 稳定 不 变 的 。 通 常 编写 一 个 重复 杂 的 输出 中 提取 必 
要 精华 信息 以 用 于 断言 是 值得 的 ， 虽 然 这 可 能 会 带 来 很 多 前 期 的 工作 ， 但 是 它 可 以 帮助 迅速 
及 时 修复 因为 项 目 演化 而 导致 的 不 合 逻 辑 的 失败 测试 。 


11.3. 测试 覆盖 率 


就 其 性 质 而 言 ， 测 试 不 可 能 是 完整 的 。 计 算 机 科学 家 Edsger Dijkstra 曾 说 过 : “测试 可 以 显示 
存在 缺陷 ， 但 是 并 不 是 说 没有 BUG 。" 再 多 的 测试 也 不 能 证 明 一 个 程序 没有 BUG 。 在 最 好 的 情 
况 下 ， 测 试 可 以 增强 我 们 的 信心 : 代码 在 我 们 测试 的 环境 是 可 以 正常 工作 的 。 

由 测试 驱动 触发 运行 到 的 被 测试 函数 的 代码 数目 称 为 测试 的 履 盖 率 。 测 试 履 盖 率 并 不 能 量化 
一 一 甚至 连 最 简单 的 动态 程序 也 难以 精确 测量 一 一 但 是 可 以 启发 并 帮助 我 们 编写 的 有 效 的 测 
RARE o 

RER S A PEGA ARER AFR AY o A A R RANAR P E SAR 
运行 一 次 的 代码 占 总 代码 数 的 比例 。 在 本 节 中 ， 我 们 使 用 go test TAP ERINA se 
工具 ， 来 度量 下 面 代码 的 测试 覆盖 率 ， 帮 助 我 们 识别 测试 和 我 们 期 望 间 的 差距 。 


下 面 的 代码 是 一 个 表格 驱动 的 测试 ， 用 于 测试 第 七 章 的 表达 式 求 值 程序 : 


gopl.io/ch7/eval 


func TestCoverage(t *testing.T) { 
var tests = []struct { 
input string 
env Env 
want string // expected error from Parse/Check or result from Eval 
Ji 
D2 tele UNE XD CEC Ceca, 
{"ltrue", nal, “unexpected '!'"}, 
{"log(10)", nil, “unknown function "log" }, 
AS Git lle) mn call eo sqrte has 2 args Wane st, 
{"sqrt(A / pi)", Env{"A": 87616, "pi": math.Pi}, "167"}, 
ENON OS i) SP (OM, GD) TEAL ENB ip Uae alo T 
{"5 / 9 * (F - 32)", Env{"F": -40}, "-40"}, 


for _, test := range tests { 
expr, err := Parse(test.input) 
if err == nil { 
err = expr.Check(map[Var ]bool{}) 
} 
if err != nil { 
if err.Error() != test.want { 
t.Errorf("%s: got %q, want %q", test.input, err, test.want) 
} 
continue 
} 
got := fmt.Sprintf("%.6g", expr.Eval(test.env) ) 
if got != test.want { 
t.Errorf("%s: %v => %s, want %s", 
test.input, test.env, got, test.want) 


首先 ， 我 们 要 确保 所 有 的 测试 都 正常 通过 : 


$ go test -v -run=Coverage gopl.io/ch7/eval 
=== RUN TestCoverage 

--- PASS: TestCoverage (0.00s) 

PASS 

ok gopl.io/ch7/eval 0.011s 


下 面 这 个 命令 可 以 显示 测试 覆盖 率 工具 的 使 用 用 法 : 


$ go tool cover 

Usage of 'go tool cover': 

Given a coverage profile produced by 'go test': 
go test -coverprofile=c.out 


Open a web browser displaying annotated source code: 
go tool cover -html=c.out 


go tool 命令 运行 Go 工具 链 的 底层 可 执行 程序 。 这 些 底 层 可 执行 程序 放 在 
rarer ${GOARCH} 目 录 。 因 为 有 go build 命令 的 原因 ， 我 们 很 少 直 
接 调 用 这 些 底层 工具 。 


现在 我 们 可 以 用 -coverprofile 标志 参数 重新 运行 测试 : 


$ go test -run=Coverage -coverprofile=c.out gopl.io/ch7/eval 
ok gopl.io/ch7/eval 0.032s coverage: 68.5% of statements 


这 个 标志 参数 通过 在 测试 代码 中 插入 生成 钩子 来 统计 履 盖 率 数 据 。 也 就 是 说 ， 在 运行 每 个 测 
试 前 ， 它 会 修改 要 测试 代码 的 副本 ， 在 每 个 词法 块 都 会 设置 一 个 布尔 标志 变量 。 当 被 修改 后 
的 被 测试 代码 运行 退出 时 ， 将 统计 日 志 数 据 写 入 c.out 文 件 ， 并 打 ae 分 执行 的 语句 的 一 个 
总 结 。 (如 果 你 需要 的 是 摘要 ， 使 用 go test -cover ° ) 


如 果 使 用 了 -covermode=count 标志 参数 > ARZA 将 在 每 个 代码 块 插 入 一 个 计数 器 而 不 是 布尔 标 
志 量 。 在 统计 结果 中 记录 了 每 个 块 的 执行 次 数 ， 这 可 以 用 于 衡量 哪些 是 被 频繁 执行 的 热点 代 
码 o 


为 了 收集 数据 ， 我 们 运行 了 测试 覆盖 率 工 具 ， 打 印 了 测试 日 志 ， 生 成 一 个 HTML 报 告 ， 然 后 在 
浏览 器 中 打开 《图 11.3) ° 


$ go tool cover -html=c.out 


coverage.htm! x 


C fi file:///home/gopher/gobook/coverage.htmi 


gopl.io/ch7/eval/eval.go (58.8%) $] not tracked not covered covered 





func (u unary) Eval(env Env) float64 { 
switch u.op { 
case ‘+': 
return +u.x.Eval(env) 
case ‘-': 
return -u.x.Eval (env) 


} 
panic(fmt.Sprintf("unsupported unary operator: %q", u.op)) 
} 


func (b binary) Eval(env Env) float64 { 

switch b. op { 
case '+' 

return b.x.Eval(env) + b.y.Eval(env) 
case ‘-' 

return b.x.Eval(env) ~ b.y.Eval(env) 
case ‘*' 

return b.x.Eval(env) * b.y.Eval(env) 
case ‘/* 

ratura b.x.Eval (env) / b.y.Eval(env) 


} 
panic(fmt,Sprintf("unsupported binary operator: %q", b.op)) 


Figure 11.3. A coverage report. 


绿色 的 代码 块 被 测试 覆盖 到 了 ， 红 色 的 则 表示 没有 被 覆盖 到 。 为 了 清晰 起 见 ， 我 们 将 的 背景 
红色 文本 的 背景 设置 成 了 阴影 效果 。 我 们 可 以 马上 发 现 unary 操 作 ee 
Aa 分 未 被 覆盖 的 代码 添加 下 面 的 测试 用 例 ， 然 后 重新 运行 上 面 的 命 

么 我 们 将 会 看 到 那个 红色 部 分 的 代码 也 变 成 绿色 了 : 


(exe =x AREeVal ETV 全 2 SA 


不 过 两 个 panic 语 名 依然 是 红色 的 。 这 是 没有 问题 的 ， 因 为 这 两 个 语句 并 不 会 被 执行 到 。 


实现 100% 的 测试 覆盖 率 听 起 来 很 美 ， 但 是 在 具体 实践 中 通常 是 不 可 行 的 ， 也 不 是 值得 推荐 的 
做 法 。 因 为 那 只 能 说 明代 码 被 执行 过 而 已 ， 并 不 意味 着 代码 就 是 没有 BUG 的 ; 因为 对 于 逻辑 
复杂 的 语句 需要 针对 不 同 的 输入 执行 多 次 。 有 一 些 语句 ， 例 如 上 面 的 panic 语 句 则 永远 都 不 会 
被 执行 到 。 另 外 ， 还 有 一 些 隐 睡 的 错误 在 现实 中 很 少 遇 到 也 很 难 编写 对 应 的 测试 代码 。 测 试 
上 来 说 是 一 个 比较 务实 的 工作 ， 编 写 测试 代码 和 编写 应 用 代码 的 成 本 对 比 是 需要 考虑 

4。 测试 覆盖 率 工 具 可 以 帮助 我 们 快速 识别 测试 薄弱 的 地 方 ， 但 是 设计 好 的 测试 用 例 和 编写 
We 


11.4. 基准 测试 


基准 测试 是 测量 一 个 程序 在 国定 工作 负载 下 的 性 能 。 在 Go 语言 中 ， 基 准 测试 函数 和 普通 测试 
函数 写法 类 似 ， 但 是 以 Benchmark 为 前 级 名 ， 并 且 带 有 一 个 *testing.B 类 型 的 参 

RL ; 有 B 参数 除了 提供 和 *testing.T 类 似 的 方法 ， 还 有 额外 一 些 和 性 能 测量 相关 的 方 
法 。 它 还 提供 了 一 个 整数 N， 用 于 指定 操作 执行 的 循环 次 数 。 


下 面 是 lsPalindrome 元 数 的 基准 测试 ， 其 中 循环 将 执行 N 次 。 
import "testing" 
func BenchmarkIsPalindrome(b *testing.B) { 


tor aee =O DAN 
IsPalindrome("A man, a plan, a canal: Panama") 


我 们 用 下 面 的 命令 运行 基准 测试 。 和 普通 测试 不 同 的 是 ， 默 认 情 况 下 不 运行 任何 基准 测试 。 


a -bench 命令 行 标志 参数 手工 指 S 。 该 参数 是 一 个 正则 表 
达 式 ， A I one ea > 默认 值 是 空 的 。 其 中 “模式 将 可 以 匹配 所 有 
基准 测试 函数 ， 但 是 这 里 总 共 只 有 一 个 基准 测试 函数 ， 因 此 和 -bench=IsPalindrome 参数 是 等 

价 的 效果 。 


$ cd $GOPATH/src/gopl.io/chii/word2 
$ go test -bench=. 


PASS 
BenchmarkIsPalindrome-8 1000000 1035 ns/op 
ok gopl.io/chi1/word2 2.179s 


结果 中 基准 测试 名 的 数字 后 组 部分， 这 里 是 8， 表 示 运 行 时 对 应 的 GOMAXPROCS 的 值 ， 这 对 
于 一 些 和 并 发 相关 的 基准 测试 是 重要 的 信息 。 


报告 显示 每 次 调用 IsPalindrome 函 数 花 费 1.035 微 秒 ， 是 执行 1,000,000 次 的 平均 时 间 。 因 为 基 

准 测试 驱动 器 开始 时 并 不 知道 每 个 基准 测试 函数 运行 所 花 的 时 间 ， 它 会 尝试 在 站 正 运行 基准 
测试 前 先 尝试 用 较 小 的 N 运 行 测试 来 估算 基准 测试 函数 所 需要 的 时 间 ， 然 后 推断 一 个 较 大 的 时 
间 保 证 稳定 的 测量 结果 。 


循环 在 基准 测试 函数 内 实现 ， 而 不 是 放 在 基准 测试 框架 内 实现 ， 这 样 可 以 让 每 个 基准 测试 函 
数 有 机 会 在 循环 启动 前 执行 初始 化 代码 ， 这 样 并 不 会 显著 影响 J 迭代 的 平均 运行 时 间 。 如 
果 还 是 担心 初始 化 代码 部 A | 量 时 间 带 来 干扰 ， 那 么 可 以 通过 testing.B 参 数 提供 的 方法 来 临 
时 关闭 或 重 置 计 时 器 ， 不 过 这 些 一 般 很 少 会 用 到 。 


现在 我 们 有 了 一 个 基准 测试 和 普通 测试 ， 我 们 可 以 很 容易 测试 新 的 让 程序 运行 更 快 的 想法 。 
也 许 最 明显 的 优化 是 在 lsPalindrome 亏 数 中 第 二 个 循环 的 停止 检查 ， 这 样 可 以 避免 每 个 比较 都 


做 两 次 : 


n := len(letters)/2 
fori = 0 ak xe m Lr 
if letters[i] != letters[len(letters)-1i-i] { 
return false 


} 


return true 


不 过 很 多 情况 下 ， 一 个 明显 的 优化 并 不 一 定 就 能 代码 预期 的 效果 。 
带 来 了 4% 的 性 能 提升 。 


$ go test -bench=. 


PASS 
BenchmarkIsPalindrome-8 1000000 992 ns/op 
ok gopl.io/chi1/word2 2.093s 


进 在 基 准 测 试 中 只 


另 一 个 改进 想法 是 在 开始 为 每 个 字符 预先 分 配 一 个 足够 大 的 数组 ， 这 样 就 可 以 避免 在 append 
调用 时 可 能 会 导致 内 存 的 多 次 重新 分 配 。 上 声明 一 个 letters 数 组 变量 ， 并 指定 合适 的 大 小 ， 像 下 


面 这 样 ， 
letters := make([]rune, 0, len(s)) 
for =, G s= range se 


if unicode.IsLetter(r) { 
letters = append(letters, unicode. ToLower(r) ) 


这 个 改进 提升 性 能 约 35%， 报 告 结果 是 基于 2,000,000 次 迭代 的 平均 运行 时 间 统 计 。 


$ go test -bench=. 


PASS 
BenchmarkIsPalindrome-8 2000000 697 ns/op 
ok gopl.io/chi1/word2 1.468s 


如 这 个 例子 所 示 ， 快 的 程序 往往 是 伴随 着 较 少 的 内 存 分 配 。 -benchmem 命令 
报告 中 包含 内 存 的 分 配 数 据 统计 。 我 们 可 以 比较 优化 前 后 内 存 的 分 配 情 ; 


$ go test -bench=. -benchmem 
PASS 
BenchmarkIsPalindrome 1000000 1026 ns/op 304 B/op 4 allocs/op 


这 是 优化 之 后 的 结果 : 


$ go test -bench=. -benchmem 
PASS 
BenchmarkIsPalindrome 2000000 807 ns/op 128 B/op 1 allocs/op 


用 一 次 内 存 分 配 代替 多 次 的 内 存 分 配 节 省 了 75% 的 分 配 调用 次 数 和 减少 近 一 半 的 内 存 需 求 。 


这 个 基准 测试 告诉 我 们 所 需 的 绝对 时 间 依 赖 给 定 的 具体 操作 ， 两 个 不 同 的 操作 所 需 时 间 的 差 

异 也 是 和 不 同 环境 相关 的 。 例 如 ， 如 果 一 个 函数 需要 1ms 处 理 1,000 个 元 素 ， 那 么 处 理 10000 
或 1 百 万 将 需要 多 少时 间 呢 ? 这 样 的 比较 揭示 了 渐 近 增长 函数 的 运行 时 间 。 另 一 个 例子 : OK 
存 该 设置 为 多 大 呢 ? 基准 测试 可 以 帮助 我 们 选择 较 小 的 缓存 但 能 带 来 满意 的 性 能 。 第 三 个 例 

子 : 对 于 一 个 确定 的 工作 那 种 算法 更 好 ? 基准 测试 可 以 评估 两 种 不 同 算法 对 于 相同 的 输入 在 

不 同 的 场景 和 负载 下 的 优 缺点 。 


一 般 比 较 基 准 测 试 都 是 结构 类 似 的 代码 。 它 们 通常 是 采用 一 个 参数 的 函数 ， 从 几 个 标志 的 基 
准 测试 函数 入 口 调 用 ， 就 像 这 样 : 


func benchmark(b *testing.B, size int) { /* ... */ } 

func Benchmark10(b *testing.B) { benchmark(b, 10) } 
func Benchmark100(b *testing.B) { benchmark(b, 100) } 
func Benchmark1000(b *testing.B) { benchmark(b, 1000) } 


通过 函数 参数 来 指定 输入 的 大 小 ， 但 是 参数 变量 对 于 每 个 具体 的 基准 测试 都 是 固定 的 。 要 避 
免 直 接 修改 b.N 来 控制 输入 的 大 小 。 除 非 你 将 它 作 为 一 个 固定 大 小 的 迭代 计算 输入 ， 否 则 基准 
测试 的 结果 将 毫 无 意义 8 


基准 测试 对 于 编写 代码 是 很 有 帮助 的 ， 但 是 即使 工作 完成 了 也 应 当 保 存 基 准 测试 代码 。 因 为 
随 着 项 目的 发 展 ， 或 者 是 输入 的 增加 ， 或 者 是 部 署 到 新 的 操作 系统 或 不 同 的 处 理 器 ， 我 们 可 
以 再 次 用 基准 测试 来 帮助 我 们 改进 设计 。 
练习 11.6: 为 2.6.2 节 的 练习 2.4 和 练习 2.5 的 PopCount 函 数 编写 基准 测试 。 看 看 基于 表格 算法 
在 不 同情 况 下 对 提升 性 能 会 有 多 大 帮助 。 


练习 11.7: 为 *IntSet (§6.5) 的 Add、UnionWith 和 其 他 方法 编写 基准 测试 ， 使 用 大 量 随机 输 
入 。 你 可 以 让 这 些 方法 跑 多 快 ? 选 择 字 的 大 小 对 于 性 能 的 影响 如 何 ? IntSet 和 基于 内 建 map 的 
实现 相 比 有 多 快 ? 


11.5. 剖析 


测量 基准 对 于 衡量 特定 操作 的 性 能 是 有 帮助 的 ， 但 是 当 我 们 视图 让 程序 跑 的 更 快 的 时 候 ， 我 
们 通常 并 不 知道 从 哪里 开始 优化 。 每 个 码 农 都 应 该 知道 Donald Knuth 在 1974 年 的 “Structured 
Programming with go to Statements”" 上 所 说 的 格言 。 虽 然 经 常 被 解读 为 不 重视 性 能 的 意思 ， 
但 是 从 原文 我 们 可 以 看 到 不 同 的 含义 : 
毫 无 疑问 ， 效 率 会 导致 各 种 小 用。 程序 员 需 要 浪费 大 量 的 时 间 思 考 或 者 担心 ， 被 部 分 程 
序 的 速度 所 干扰 ， 实 际 上 这 些 尝试 提升 效率 的 行为 可 能 产生 强烈 的 负面 有 影响， 特别 是 当 
调试 和 维护 的 时 候 。 我 们 不 应 该 过 度 纠 结 于 细节 的 优化 ， 应 该 说 约 97% 的 场景 : 过 早 的 
优化 是 万 恶 之 源 。 


我 们 当然 不 应 该 放弃 那 关 键 的 3% 的 机 会 。 一 个 好 的 程序 员 不 会 因为 这 个 理由 而 满足 ， 他 
ts 地 观察 和 识别 哪些 是 关键 的 代码 ; 人 笃 被 确认 的 前 提 下 才 

进行 优化 。 对 于 判断 哪些 部 分 是 关键 代码 是 经 常 容易 犯 经 验 性 错误 的 地 方 ， 因 此 程序 
Leanne 量 工 具 ， 使 得 他 们 的 直觉 很 不 靠 谱 。 


当 我 们 想 仔细 观察 我 们 程序 的 运行 速度 的 时 候 ， 最 好 的 技术 是 如 何 识别 关键 代码 。 自 动 化 的 
剖析 技术 是 基于 程序 执行 期 间 一 些 抽 样 数据 ， 然 后 推断 后 面 的 执行 状态 ; 最 终 产生 一 个 运行 
时 间 的 统计 数据 文件 。 


Go 语言 支持 多 种 类 型 的 剖析 性 能 分 析 ， 每 一 种 关注 不 同 的 方面 ， 但 它们 都 涉及 到 每 个 采样 记 
录 的 感 兴 趣 的 一 系列 事件 消息 ， 每 个 事件 都 包含 函数 调用 时 函数 调用 堆栈 的 信息 。 内 建 的 go 
test 工具 对 几 种 分 析 方 式 都 提供 了 支持 。 

CPU 分 析 文 件 标 识 了 函数 执行 时 所 需要 的 CPU 时 间 。 当 前 运行 的 系统 线程 在 每 隔 几 毫 秒 都 会 
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遇 到 操作 系统 的 中 断 事 件 ， 每 次 中 断 时 都 会 记录 一 个 分 析 文 件 然后 恢复 正常 的 运行 。 


堆 分 析 则 记录 了 程序 的 内 存 使 用 情况 。 每 个 内 存 分 配 操作 都 会 触发 内 部 平均 内 存 分 配 例 程 
每 个 512KB 的 内 存 申 请 都 会 触发 一 个 事件 。 


阻塞 分 析 则 记录 了 goroutine 最 大 的 阻塞 操作 ， 例 如 系统 调用 、 管 道 发 送 和 接收 ， 还 有 获取 锁 
等 。 分 析 库 会 记录 每 个 goroutine 被 阻塞 时 的 相关 操作 。 


在 测试 环境 下 只 需要 一 个 标志 参数 就 可 以 生成 各 种 分 析 文 件 。 当 一 次 使 用 多 个 标志 参数 时 需 
要 当心 ， 因 为 分 析 操 作 本 身 也 可 能 会 影像 程序 的 运行 。 


$ go test -cpuprofile=cpu. out 
$ go test -blockprofile=block.out 
$ go test -memprofile=mem. out 


对 于 一 些 非 测试 程序 也 很 容易 支持 分 析 的 特性 ， 具 体 的 实现 方式 和 程序 是 短 时 间 运 行 的 小 工 
具 还 是 长 时 间 运 行 的 服务 会 有 很 大 不 同 ， 因 此 Go 的 runtime 运 行 时 包 提 供 了 程序 运行 时 控制 分 
析 特 性 的 接口 。 


一 旦 我 们 已 经 收集 到 了 用 于 分 析 的 采样 数据 ， 我 们 就 可 以 使 用 pprof 来 eran’ 这 是 Go 

具 箱 自 带 的 一 个 工具 ， 但 并 不 是 一 个 日 常 工具 ， 它 对 应 go tool ppro 命令 。 该 命令 有 许多 
特性 和 选项 ， 但 是 最 重要 的 有 两 个 ， 就 是 生成 这 人 分 析 日 志 
文件 。 


为 了 提高 分 析 效 率 和 减少 空间 ， 分 析 日 志 本 身 并 不 包含 函数 的 名 字 ; 它 只 包含 函数 对 应 的 地 
址 。 也 就 是 说 pprof 需 要 和 分 析 日 志 对 于 的 可 执行 程序 。 虽 然 go test 命令 通常 会 丢弃 临时 用 
的 测试 程序 ， 但 是 在 启用 分 析 的 时 候 会 将 测试 程序 保存 为 foo.test 文 件 ， 其 中 foo 部 分 对 于 测试 
包 的 名 字 


TANTA 演示 了 如 何 生 成 一 个 CPU ie 我 们 选择 net/http 包 的 一 个 基准 测试 为 例 。 
通常 是 基于 一 个 已 经 确定 了 是 关键 代码 的 部 分 进行 基准 测试 。 基 准 测 试 会 默认 包含 单元 测 
试 ， eo Hehe EN o 


$ go test -run=NONE -bench=ClientServerParallelTLS64 \ 
-cpuprofile=cpu.log net/http 
PASS 
BenchmarkClientServerParallelTLS64-8 1000 
3141325 ns/op 143010 B/op 1747 allocs/op 
ok net/http 3.395s 


$ go tool pprof -text -nodecount=10 ./http.test cpu.log 
2570ms of 3590ms total (71.59%) 
Dropped 129 nodes (cum <= 17.95ms) 
Showing top 10 nodes out of 166 (cum >= 60ms) 
flat flat% sum% cum cum% 
1730ms 48.19% 48.19% 1750ms 48.75% crypto/elliptic.p256ReduceDegree 


230ms 6.41% 54.60%  250ms 6.96% crypto/elliptic.p256Diff 
120ms 3.34% 57.94% 120ms 3.34% math/big.addMulVVW 
110ms 3.06% 61.00%  110ms 3.06% syscall.Syscall 
90ms 2.51% 63.51% 1130ms 31.48% crypto/elliptic.p256Square 
70ms 1.95% 65.46%  120ms 3.34% runtime.scanobject 
60ms 1.67% 67.13%  830ms 23.12% crypto/elliptic.p256Mul 
60ms 1.67% 68.80%  190ms 5.29% math/big.nat.montgomery 
50ms 1.39% 70.19% 50ms 1.39% crypto/elliptic.p256ReduceCarry 
50ms 1.39% 71.59% 60ms 1.67% crypto/elliptic.p256Sum 
参数 -text 用 于 指定 输出 格式 ， 在 这 里 每 行 是 人 
其 中 -nodecount=10 标志 参数 限制 了 于 的 结果 。 对 于 严重 的 性 能 问题 ， 这 个 文本 格 


式 基本 可 以 帮助 碍 明 原 了 。 


这 个 概要 文件 告诉 我 们 ，HTTPS 基 准 测试 中 crypto/elliptic.p256ReduceDegree 函数 占用 了 将 
近 一 半 的 CPU 资源 。 相 比 之 下 ， 如 果 一 个 概要 文件 中 主要 是 runtime 包 的 内 存 分 配 的 函数 ， 那 
么 减少 内 存 消 耗 可 能 是 一 个 值得 尝试 的 优化 策略 。 


对 于 一 些 更 微妙 的 问题 ， 你 可 能 需要 使 用 pprof 的 图 形 显示 功能 。 这 个 需要 安装 GraphViz 工 
E> TAM http://www.graphviz.org 下 载 。 参 数 -web 用 于 生成 一 个 有 向 图 文件 ， 包 含 了 CPU 
的 使 用 和 最 热点 的 函数 等 信息 。 


这 一 节 我 们 只 是 简单 看 了 下 Go 语言 的 分 析 据 工 具 。 如 果 想 了 解 更 多 ， 可 以 阅读 Go 官方 博客 
的 “Profiling Go Programs”— X ° 


11.6. 示例 函数 


第 三 种 go test 特别 处 理 的 函数 是 示例 函数 ， 以 Example 为 函数 名 开头 。 示 例 函 数 没 有 函数 参 
数 和 返回 值 。 下 面 是 IsPalindrome 函 数 对 应 的 示例 函数 : 


func ExampleIsPalindrome() { 
fmt.Println(IsPalindrome("A man, a plan, a canal: Panama") ) 
fmt .Println(IsPalindrome("palindrome")) 
// Output: 
Hi eS 
// false 


示例 函数 有 三 个 用 处 。 最 主要 的 一 个 是 作为 文档 : 一 个 包 的 例子 可 以 更 简洁 直观 的 方式 来 演 
示 函 数 的 用 法 ， 比 文字 描述 更 直接 易 懂 ， 特 别 是 作为 一 个 提醒 或 快速 参考 时 。 一 个 示例 函数 
也 可 以 方便 展示 属于 同一 个 接口 的 几 种 类 型 或 函数 直接 的 关系 ， 所 有 的 文档 都 必须 关联 到 一 
个 地 方 ， 就 像 一 个 类 型 或 函数 声明 都 统一 到 包 一 样 。 同 时 ， 示 例 函 数 和 注释 并 不 一 样 ， 示 例 
BHR AE AL MGR BRE LIES HY MIEN IH > HTM RE THANG LAME 
成 不 能 使 用 的 盏 代码。 


根据 示例 函数 的 后 组 名 部 分 ，godoc 的 web 文 档 会 将 一 个 示例 函数 关联 到 某 个 具体 函数 或 包 本 
身 ， 因 此 ExamplelsPalindrome 示 例 函 数 将 是 IsPalindrome 有 函数 文档 的 一 部 分 ，Example 示 例 
函数 将 是 包 文档 的 一 部 分 。 


示例 文档 的 第 二 个 用 处 是 在 go test 执行 测试 的 时 候 也 运行 示例 函数 测试 。 如 果 示 例 函 数 内 
含有 类 似 上 面 例子 中 的 // output: 格式 的 注释 ， 那 么 测试 工具 会 执行 这 个 示例 函数 ， 然 后 检 
测 这 个 示例 函数 的 标准 输出 和 注释 是 否 匹配 。 


示例 函数 的 第 三 个 目的 提供 一 个 真实 的 演练 场 。 http://golang.org 就 是 由 godoc 提 供 的 文档 服 
务 ， 它 使 用 了 Go Playground 提 高 的 技术 让 用 户 可 以 在 浏览 器 中 在 线 编辑 和 运行 每 个 示例 函 
数 ， 就 像 图 11.4 所 示 的 那样 。 这 通常 是 学 习 函 数 使 用 或 Go 语言 特性 最 快捷 的 方式 。 


func Join 


func Join(a []string, sep string) string 


Join concatenates the elements of a to create a single string. The separator string 
sep is placed between elements in the resulting string. 


v Example 





Figure 11.4. An interactive example of strings.Join in godoc. 


本 书 最 后 的 两 掌 是 讨论 reflect 和 unsafe 包 ， 一 般 的 Go 用 户 很 少 直 接 使 用 它们 。 因 此 ， 如 果 你 
还 没有 写 过 任何 真实 的 Go 程序 的 话 ， 现 在 可 以 忽略 剩余 部 分 而 直接 编码 了 。 


示例 函数 nee 


第 十 二 章 BA 


Go 语音 提供 了 一 种 机 制 在 运行 时 更 新 变量 和 检查 它们 的 值 、 调 用 它们 的 方法 和 它们 支持 的 内 
在 操作 ， 但 是 在 编译 时 并 不 知道 这 些 变量 的 具体 类 型 。 这 种 机 制 被 称 为 反射 。 反 射 也 可 以 让 
我 们 将 类 型 本 身 作为 第 一 类 的 值 类 型 处 理 。 


在 本 章 ， 我 们 将 探讨 Go 语言 的 反射 特性 ， 看 看 它 可 以 给 语言 增加 哪些 表达 力 ， 以 及 在 两 个 至 
关 重 要 的 API 是 如 何 用 反射 机 制 的 : 一 个 是 fmt 包 提供 的 字符 串 格 式 功能 ， 另 一 个 是 类 似 
encoding/json 和 encoding/xml 提 供 的 针对 特定 协议 的 编 解 码 功能 。 对 于 我 们 在 4.6 节 中 看 到 过 
的 text/template 和 html/template 包 ， 它 们 的 实现 也 是 依赖 反射 技术 的 。 然 后 ， 反 射 是 一 个 复杂 
的 内 省 技术 ， 不 应 该 随意 使 用 ， 因 此 ， 尽 管 上 面 这 些 包 内 部 都 是 用 反射 技术 实现 的 ， 但 是 它 
们 自己 的 API 都 没有 公开 反射 相关 的 接口 。 


12.1. 为 何 需 要 反射 ? 


有 时 候 我 们 需要 编写 一 个 函数 能 够 处 理 一 类 并 不 满足 普通 公 oie 值 ， 也 可 能 是 因 
为 它们 并 没有 确定 的 表示 方式 ， 或 者 是 在 我 们 设计 该 函数 的 时 候 还 这 些 类 型 可 能 还 不 存在 ， 


各 种 情况 都 有 可 能 。 


一 个 大 家 熟悉 的 例子 是 fmt.Fprintf 骂 数 提供 的 字符 串 格 式 化 处 理 逻 辑 ， 它 可 以 用 例 对 任意 类 型 
的 值 格 式 化 并 打印 ， 其 至 支持 用 户 自 定义 的 类 型 。 让 我 们 也 来 尝试 实现 一 个 类 似 功 能 的 函 
数 。 为 了 简单 起 见 ， 我 们 的 函数 只 接收 一 个 参数 ， 然 后 返回 和 fimt.Sprint 类 似 的 格式 化 后 的 字 
符 串 。 我 们 实现 的 函数 名 也 叫 Sprint 。 


我 们 使 用 了 switch 类 型 分 支 首 先 来 测试 输入 参数 是 否 实现 了 String 方 法 ， 如 果 是 的 话 就 使 用 该 
方法 。 然 后 继续 增加 类 型 测试 分 支 ， 检 查 是 否 是 每 个 基于 string、int、bool 等 基础 类 型 的 动态 
类 型 ， 并 在 每 种 情况 下 执行 相应 的 格式 化 操作 。 


func Sprint(x interface{}) string { 
type stringer interface { 
String() string 
} 
switch x := x.(type) { 
case stringer: 
return x.String() 
case string: 
return x 
case int: 
return strconv.Itoa(x) 


// ...Similar cases for inti6, uint32, and so on 
case bool: 

ali 3 af 

return "true" 

} 

return "false" 
default: 

// array, chan, func, map, pointer, slice, struct 


return 4222n 


但 是 我 们 如 何 处 理 其 它 类 似 [float64 ` map[stringllstring 等 半 类 型 呢 ? 我 们 当然 可 以 添加 更 多 的 
测试 分 支 ， 但 是 这 些 组 合 类 型 的 数目 基本 是 无 穷 的 。 还 有 如 何 处 理 url.Values 等 命名 的 类 型 
呢 ? 虽然 类 型 分 支 可 以 识别 出 底层 的 基础 类 型 是 mapl[string][]string， 但 是 ne 匹配 
url.Values 类 型 ， 因 为 它们 是 两 种 不 同 的 类 型 ， 而 且 switch 类 型 分 支 也 不 可 能 包含 每 个 类 似 
url.Values 的 类 型 ， 这 会 导致 对 这 些 库 的 循环 依赖 。 


没有 一 种 方法 来 检查 未 知 类 型 的 表示 方式 ， 我 们 被 卡 住 了 。 这 就 是 我 们 为 何 需 要 反射 的 原 
o 


12.2. reflect. Type#7reflect.Value 


反射 是 由 reflect 包 提 供 支 持 . 它 定 义 了 两 个 重要 的 类 型 , Type 和 Value. 一 个 Type 表示 一 个 
Go 类 型 . 它 是 一 个 接口 , 有 许多 方法 来 区 分 类 型 和 检查 它们 的 组 件 , 例如 一 个 结构 体 的 成 员 或 
一 个 函数 的 参数 等 . 唯一 能 反映 reflect.Type 实现 的 是 接口 的 类 型 描述 信息 (§7.5), 同样 的 实体 
标识 了 动态 类 型 的 接口 值 . 


函数 reflect.TypeOf 接受 任意 的 interface 人 {} 类 型 , 并 返回 对 应 动态 类 型 的 reflect.Type: 


t := reflect.TypeOf(3) // a reflect.Type 
fmt.Println(t.String()) // " 
fmt.Println(t) fie Sadat 


其 中 TypeOf(3) 调用 将 值 3 6A interface} 类 型 参数 传 入 . 回 到 7.57 的 将 一 个 具体 的 值 转 为 
接口 类 型 会 有 一 个 隐 式 的 接口 转换 操作 , 它 会 创建 一 个 包含 两 个 信息 的 接口 值 : 操作 数 的 动态 
类 型 (这 里 是 int) 和 它 的 动态 的 值 (这 里 是 3). 


因为 reflect.TypeOf 返回 的 是 一 个 动态 类 型 的 接口 值 , 它 总 是 返回 具体 的 类 型 . 因此 , 下 面 的 代 
码 将 打印 “os.File" 而 不 是 "io.Writer". 稍 后 , 我 们 将 看 到 reflect.Type 是 具有 识别 接口 类 型 的 
表达 方式 功能 的 . 


var w io.Writer = os.Stdout 
fmt.Println(reflect.TypeOf(w)) // "*os.File" 


要 注意 的 是 reflect.Type 接口 是 满足 fmt.Stringer 接口 的 . 因为 打印 动态 类 型 值 对 于 调试 和 日 
志 是 有 帮助 的 , fmt.Printf 提供 了 一 个 简短 的 %T 标志 参数 , 内 部 使 用 reflect.TypeOf 的 结果 输 
出 : 


fmt.Printf("%T\n", 3) // "int" 


reflect 包 中 另 一 个 重要 的 类 型 是 Value. —* reflect. Value 可 以 持 有 一 个 任意 类 型 的 值 . 函数 
reflect.ValueOf 接受 任意 的 interfacef{} 类 型 , 并 返回 对 应 动态 类 型 的 reflect.Value. 和 
reflect.TypeOf 类 似 , reflect.ValueOf 返回 的 结果 也 是 对 于 具体 的 类 型 , 但 是 reflect.Value 也 可 
以 持 有 一 个 接口 值 . 


v i= reflect.ValueOf(3) // a reflect .Value 
fmt.Println(v) We el 
fmt.Printf("%v\n", v) HH Mey 


fmt.Println(v.String()) // NOTE: "<int Value>" 


和 reflect.Type 类 似 , reflect. Value 也 满足 fmt.Stringer 接口 , 但 是 除非 Value 持 有 的 是 字符 串 ， 
否则 String 只 是 返回 具体 的 类 型 . 相同 , 使 用 fmt 包 的 %v 标志 参数 , 将 使 用 reflect.Values 的 
结果 格式 化 . 


调用 Value 的 Type 方法 将 返回 具体 类 型 所 对 应 的 reflect. Type: 


t := v.Type() // a menr lecti nye 
fmt.Println(t.String()) // "int" 


逆 操作 是 调用 reflect.ValueOf 对 应 的 reflect.Value.Interface 方法 . 它 返 回 一 个 interface{} 类 型 
表示 reflect.Value 对 应 类 型 的 具体 值 : 


v := reflect.ValueOf(3) // a ref 
x := v.Interface() // an in 





i := x.(int) // an int 
fmt.Printf("%d\n", i) Hip Mey 


一 个 reflect.Value 和 interface{} 都 能 保存 任意 的 值 . 所 不 同 的 是 , 一 个 空 的 接口 隐藏 了 值 对 应 
的 表示 方式 和 所 有 的 公开 的 方法 , 因此 只 有 我 们 知道 具体 的 动态 类 型 才能 使 用 类 型 断言 来 访问 
内 部 的 值 (就 像 上 面 那样 ) 对 于 内 部 值 并 没有 特别 可 做 的 事情 . 相 比 之 下 , 一 个 Value 则 有 很 多 
方法 来 检查 其 内 容 , 无 论 它 的 具体 类 型 是 什么 . 让 我 们 再 次 尝试 实现 我 们 的 格式 化 函数 
format.Any. 

我 们 使 用 reflect.Value 的 Kind 方法 来 替代 之 前 的 类 型 switch. 虽然 还 是 有 无 穷 多 的 类 型 , 但 是 
它们 的 kinds 类 型 却 是 有 限 的 : Bool, String 和 所 有 数字 类 型 的 基础 类 型 ; Array 和 Struct 对 应 
的 聚合 类 型 ; Chan, Func, Ptr, Slice, 和 Map 对 应 的 引用 类 似 ; 接口 类 型 ; 还 有 表示 空 值 的 无 效 
类 型 . ( 空 的 reflect.Value 对 应 Invalid 无 效 类 型 .) 


gopl.io/ch12/format 


package format 


import ( 
"reflect" 
“StrConv 
) 


// Any formats any value as a string. 
func Any(value interface{}) string { 
return formatAtom(reflect.ValueOf(value) ) 


// formatAtom formats a value without inspecting its internal structure. 
func formatAtom(v reflect.Value) string { 

switch v.Kind() { 

case reflect.Invalid: 
return "invalid" 

case reflect.Int, reflect.Int8, reflect.Int16, 
reflect.Int32, reflect.Int64: 
return strconv.FormatInt(v.Int(), 10) 

case reflect.Uint, reflect.Uint8, reflect.Uint16, 
reflect.Uint32, reflect.Uint64, reflect.Uintptr: 
return strconv.FormatUint(v.Uint(), 10) 

// ...floating-point and complex cases omitted for brevity... 

case reflect.Bool: 
return strconv.FormatBool(v.Bool()) 

case reflect.String: 
return strconv.Quote(v.String()) 

case reflect.Chan, reflect.Func, reflect.Ptr, reflect.Slice, reflect.Map: 
return v.Type().String() + " Ox" + 

strconv.FormatUint(uint64(v.Pointer()), 16) 

default: // reflect.Array, reflect.Struct, reflect.Interface 

return v.Type().String() + " value" 


到 目前 为 止 , 我 们 的 函数 将 每 个 值 视 作 一 个 不 可 分 割 没有 内 部 结构 的 , ALLE formatAtom. 
对 于 聚合 类 型 (结构 体 和 数组 ) 个 接口 只 是 打印 类 型 的 值 , 对 于 引用 类 型 (channels, functions, 
pointers, slices, 和 maps), 它 十 六 进 制 打印 类 型 的 引用 地 址 . 虽然 还 不 够 理想 , 但 是 依然 是 一 个 
重大 的 进步 , 并且 Kind 只 关心 底层 表示 , format.Any 也 支持 新 命名 的 类 型 . 例如 : 


var x int64 = 1 
var d time.Duration = 1 * time.Nanosecond 


fmt.Println( format .Any(x)) ie a 
fmt .Println(format.Any(d) ) Hip “Pas 
fmt .Println( format .Any([]int64{x}) ) // "[]int64 0x8202b87b0" 


fmt .Println(format.Any([]time.Duration{d})) // "[]time.Duration 0x8202b87e0" 


Go 语 = 圣经 


reflect.Type 和 reflect.Value 433 


12.3. Display 2 )/2 47 fP 
接 下 来 ， 让 我 们 看 看 如 何 改 善 有 聚合 数 据 类 型 的 显示 。 我 们 并 不 想 完全 克隆 一 个 fmt.Sprint 艺 
数 ， 我 们 只 是 像 构建 一 个 用 于 调式 用 的 Display 却 数 ， 给 定 一 个 聚合 类 型 x， 打 印 这 个 值 对 应 的 


完整 的 结构 ， 同 时 记录 每 个 发 现 的 每 个 元 素 的 路 径 。 让 我 们 从 一 个 例子 开始 。 


e, _ := eval.Parse("sqrt(A / pi)") 
Display("e", e) 


EMA? > %ADisplay BRN SREET IP -—SRAN RB BRET BEM © 
Display & 2 49 fay who TF : 


Display e (eval.call): 


e.fn = "sqrt" 

e.args[0].type = eval.binary 
e.args[0].value.op = 47 
e.args[0].value.x.type = eval.Var 
e.args[0].value.x.value = "A" 
e.args[0].value.y.type = eval.Var 
e.args[0].value.y.value = "pi" 


在 可 能 的 情况 下 ， 你 应 该 避免 在 一 个 包 中 暴露 和 反射 相关 的 接口 。 我 们 将 定义 一 个 未 导出 的 
display 哆 数 用 于 递归 处 理工 作 ， 导 出 的 是 Display 元 数 ， 它 只 是 display 兄 数 简单 的 包装 以 接受 
interface 人 人 } 类 型 的 参数 : 


gopl.io/ch12/display 


func Display(name string, x interface{}) { 
fmt.Printf("Display %s (%T):\n", name, x) 
display(name, reflect.ValueOf (x) ) 


在 display 函 数 中 ， 我 们 使 用 了 前 面 定 义 的 打印 基础 类 型 一 “基本 类 型 、 函 数 和 chan 等 一 元 
素 值 的 formatAtom 函 数 ， 但 是 我 们 会 使 用 reflect.Value 的 方法 来 递 由 显示 聚合 类 型 的 每 一 个 成 
员 或 元素。 在 递归 下 降 过 程 中 ，path 字 符 串 ， 从 最 开始 传 入 的 起 始 值 (这 里 是 “e") ， 将 和 逐步 
增长 以 表示 如 何 达 到 当前 值 (例如 “e.args[0].value”) ° 


为 我 们 不 再 模拟 fmt.Sprint 元 数 ， 我 们 将 直接 使 用 fmt 包 来 简化 我 们 的 例子 实现 。 


func display(path string, v reflect.Value) { 
switch v.Kind() { 
case reflect.Invalid: 
fmt.Printf("%s = invalid\n", path) 
case reflect.Slice, reflect.Array: 
for i := 0; i < v.Len(); it+ { 
display(fmt.Sprintf("%s[%d]", path, i), v.Index(i)) 
} 
case reflect.Struct: 
for i := 0; i < v.NumField(); i++ { 
fieldPath := fmt.Sprintf("%s.%s", path, v.Type().Field(i).Name) 
display(fieldPath, v.Field(i)) 
} 
case reflect.Map: 
for _, key := range v.MapKeys() { 
display(fmt.Sprintf("%s[%s]", path, 
formatAtom(key)), v.MapIndex(key) ) 
} 


case reflect.Ptr: 
if v.IsNil() { 
fmt.Printf("%s = nil\n", path) 
+ else { 
display(fmt.Sprintf("(*%s)", path), v.Elem()) 
} 


case reflect.Interface: 
if v.IsNil() { 
fmt.Printf("%s = nil\n", path) 
} else { 
fmt.Printf("%s.type = %s\n", path, v.Elem().Type()) 
display(patht+".value", v.Elem()) 


} 
default: // basic types, channels, funcs 
fmt.Printf("%s = %s\n", path, formatAtom(v) ) 


让 我 们 针对 不 同类 型 分 别 讨论 。 


Slice 和 数组 : 两 种 的 处 理 逻 辑 是 一 样 的 。Len 方 法 返回 slice 或 数组 值 中 的 元 素 个 数 ，|ndex(i) 
活动 索引 i 对 应 的 元 素 ， 返 回 的 也 是 一 个 reflect.Value 类 型 的 值 ; 如 果 索 引 i 超出 范围 的 话 将 导致 
panic 出 常 ， 这 些 行为 和 数组 或 slice 类 型 内 建 的 len(a) 和 ali] 等 操作 类 似 。display 针 对 序列 中 的 
每 个 元 素 递归 调用 自身 处 理 ， 我 们 通过 在 递归 处 理 时 向 path 附 加 “[i]" 来 表示 访问 路 径 。 


虽然 reflect.Value 类 型 带 有 很 多 方法 ， 但 是 只 有 少数 的 方法 对 任意 值 都 是 可 以 安全 调用 的 。 例 
如 ，Index 方 法 只 能 对 Slice、 数 组 或 字符 串 类 型 的 值 调 用 ， 其 它 类 型 如 果 调 用 将 导致 panic 异 


ae 


m o 


结构 体 : NumField 方 法 报告 结构 体 中 成 员 的 数量 ，Field(i) 以 reflect.Value 类 型 返回 第 i 个 成 员 
的 值 。 成 员 列 表 包 含 了 匿名 成 员 在 内 ati 。 通 过 在 path 添 加 “.f 来 表示 成 员 路 径 ， 我 们 
必须 获得 结构 体 对 应 的 reflect.Type 类 型 信息 ， 包 含 结构 体 类 型 和 第 i 个 成 员 的 名 字 。 


Mapa MapKeys 方 法 返回 一 个 reflect.Value 类 型 的 slice， 每 一 个 都 对 应 map 的 可 以 。 和 往常 一 
样 ， 遍 历 map 时 顺序 是 随机 的 。Maplndex(key) 返 回 map 中 key 对 应 的 value。 我 们 向 path 添 
加 *[key]" 来 表示 访问 路 径 。 (我 们 这 里 有 一 个 未 完成 的 工作 。 其 实 map 的 key 的 类 型 并 不 局 限 
于 formatAtom 能 完美 处 理 的 类 型 ; 数组 、 结 构 体 和 接口 都 可 以 作为 map 的 key。 针 对 这 种 类 
型 ， 完 善 key 的 显示 信息 是 练习 12.1 的 任务 。) 


指针 : Elem 方 法 返回 指针 指向 的 变量 ， 还 是 reflect.Value 类 型 。 技 术 指 针 是 nil， 这 个 操作 也 
是 安全 的 ， 在 这 种 情况 下 指 An ， 但 是 我 们 可 以 用 IsSNil 方 法 来 显 式 地 测试 一 个 
空 指针 ， 这 样 我 们 可 以 打印 更 合适 的 信息 。 我 们 在 path 前 面 添加 “*"， 并 用 括 缴 包 含 以 避免 歧 


接口 : 再 一 次 ， 我 们 使 用 IsNil 方 法 来 测试 接口 是 否 是 nil， 如 果 不 是 ， 我 们 可 以 调用 VElem() 来 
获取 接口 对 应 的 动态 值 ， 并 且 打 印 对 应 的 类 型 和 值 。 


现在 我 们 的 Display 函 数 总 萌 完 工 了 ， 让 我 们 看 看 它 的 表现 吧 。 下 面 的 Movie 类 型 是 在 4.5 节 的 
电影 类 型 上 演变 来 的 : 


type Movie struct { 
Title, Subtitle string 


Year int 

Color bool 

Actor map[string]string 
Oscars []string 

Sequel *string 


让 我 们 声明 一 个 该 类 型 的 变量 ， 然 后 看 看 Display 函 数 如 何 显示 它 





strangelove 
Title: 


:= Movie{ 
"Dr. Strangelove", 


Subtitle: "How I Learned to Stop Worrying and Love the Bomb", 


Year: 
Color: 


1964, 
false, 


Actor: map[string]string{ 


UD Ge 


Strangelove": “Peter sellerss, 


"Grp. Capt. Lionel Mandrake": "Peter Sellers", 


"Pres. Merkin Muffley": 
"Gen. Buck Turgidson": 
Brag. Gen. Jack Di Rappers: 


"Peter Sellers", 
"George C. Scott", 
"Sterling Hayden", 


TIEKIN Kong "Slim Pickens’, 


[]string{ 


"Best Actor (Nomin.)", 


"Best Adapted Screenplay (Nomin.)", 


"Best Director (Nomin.)", 


"Best Picture (Nomin.)", 


“Maj. 
}, 
Oscars: 
}, 


Display("strangelove", strangelove) 调 用 将 显示 (strangelove 电 影 对 应 的 中 文 名 是 《 奇 爱 博 
士 》) 


Display strangelove (display.Movie): 


strangelove. 
strangelove. 
strangelove. 
strangelove. 
strangelove. 
strangelove. 
strangelove. 
strangelove. 
strangelove. 
strangelove. 
strangelove. 
strangelove. 
strangelove. 
strangelove. 
strangelove. 


RML T VASE A Display H a K E oh ta HEP AA ASB 2S Ay > Hilde *os.File 类 型 : 





Title = "Dr. Strangelove" 

Subtitle = "How I Learned to Stop Worrying and Love the Bomb" 
Year = 1964 

Color = false 

Actor["Gen. Buck Turgidson"] = "George C. Scott" 

Actor["Brig. Gen. Jack D. Ripper"] = "Sterling Hayden" 
Actor["Maj. T.J. \"King\" Kong"] = "Slim Pickens" 

Actor["Dr. Strangelove"] = "Peter Sellers" 

Actor["Grp. Capt. Lionel Mandrake"] = "Peter Sellers" 
Actor["Pres. Merkin Muffley"] = "Peter Sellers" 


Oscars[0] = "Best Actor (Nomin.)" 

Oscars[1] = "Best Adapted Screenplay (Nomin.)" 
Oscars[2] = "Best Director (Nomin.)" 

Oscars[3] = "Best Picture (Nomin.)" 

Sequel = nil 


Display("os.Stderr", os.Stderr) 

// Output: 

// Display os.Stderr (*os.File): 

Li MOSS ECE ele) kire) ftd = 2 

J/ (= (“os..stdenn)ahile) name = “/dev/stdente” 
// (*(*0s.Stderr). fale). nepipe = © 


要 注意 的 是 ， 结 构 体 中 未 导出 的 成 员 对 反射 也 是 可 见 的 。 需 要 当心 的 是 这 个 例子 的 输出 在 不 
同 操作 系统 上 可 能 是 不 同 的 ， 并 且 随 着 标准 库 的 发 展 也 可 能 导致 结果 不 同 。 (这 也 是 将 这 些 
成 员 定义 为 私有 成 员 的 原因 之 一 ! ) 我 们 深圳 可 以 用 Display 骂 数 来 显示 reflect.Value， 来 查 
看 *os.File 类 型 的 内 部 表示 方式 ° Display("rv", reflect.Value0f(os.Stderr)) 调用 的 输出 如 
下 ， 当 然 不 同 环境 得 到 的 结果 可 能 有 差异 : 


观 


Display rV (reflect.Value): 
(*rV.typ).size = 8 
(*rV.typ).hash = 871609668 
(*rV.typ).align = 8 
(*rV.typ).fieldAlign = 8 
(*rV.typ).kind = 22 
(*(*rvV.typ).string) = "*os.File" 


(*(*(*rvV.typ).uncommonType).methods[0].name) = "Chdir" 
(*(*(*(*rv. typ) .uncommonType).methods[0].mtyp).string) = "func() error" 
(*(*( 


* 


( 
i *(*rV.typ).uncommonType).methods[0].typ).string) = "func(*os.File) error" 


察 下 面 两 个 例子 的 区 别 : 


var i interface{} = 3 


Display("i", i) 

// Output: 

// Display i (int): 
//i=83 


Display("&i", &i) 

// Output: 

// Display &i (*interface {}): 
// (*&i).type = int 

// (*&1).value = 3 


在 第 一 个 例子 中 ，Display 函 数 将 调用 reflect.ValueOf()， 它 返回 一 个 Int 类 型 的 值 。 正 如 我 们 在 
12.2 节 中 提 到 的 ，reflect.ValueOf 总 是 返回 一 个 值 的 具体 类 型 ， 因 为 它 是 从 一 个 接口 值 提取 的 


在 第 二 个 例子 中 ，Display 函 数 调用 的 是 reflect.ValueOf(&i)， 它 返回 一 个 指向 i 的 指针 ， 对 应 Ptr 
类 型 。 在 Switch 的 Ptr 分 支 中 ， 通 过 调用 Elem 来 返回 这 个 值 ， 返 回 一 个 Value 来 表示 1， 对 应 
Interface 类 型 。 一 个 间接 获得 的 Value， 就 像 这 一 个 ， 可 能 代表 任意 类 型 的 值 ， 包 括 接口 类 
型 。 内 部 的 display 函 数 递 愉 调用 自身 ， 这 次 它 将 打印 接口 的 动态 类 型 和 值 。 


目前 的 实现 ，Display 如 果 显示 一 个 带 环 的 数据 结构 将 会 陷入 死 循环 ， 例 如 首位 项 链 的 链表 : 


// a struct that points to itself 

type Cycle struct{ Value int; Tail *Cycle } 
var c Cycle 

c = Cycle{42, &c} 

Display("c", c) 


Display 会 永远 不 停 地 进行 深度 递归 打印 : 


Display c (display.Cycle): 

c.Value = 42 

(*c.Tail).Value = 42 
(*(*c.Tail).Tail).Value = 42 
(*(*(*c.Tail).Tail).Tail).Value = 42 
...ad infinitum... 
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的 ， 需 要 增加 一 个 额外 的 记录 访问 的 路 径 ; 代价 是 昂贵 的 。 一 般 的 解决 方案 是 采用 不 安全 的 
语言 特性 ， 我 们 将 在 13.3 节 看 到 具体 的 解决 方案 。 


带 环 的 数据 结构 很 少 会 对 fmt.Sprint 函 数 造 成 问题 ， 因 为 它 很 少 尝 试 打印 完整 的 数据 结构 。 例 
如 ， 当 它 遇 到 一 个 指针 的 时 候 ， 它 只 是 简单 第 打印 指针 的 数值 。 虽 然 ， 在 打印 包含 自身 的 
slice 或 map 时 可 能 遇 到 困难 ， 但 是 不 保证 处 理 这 种 是 军 见 情况 却 可 以 避免 额外 的 麻烦 。 


练习 12.1 : 扩展 Displayhans， 以 便 它 可 以 显示 包含 以 结构 体 或 数组 作为 map 的 key 类 型 的 
值 。 


练习 12.2 : 增强 display 元 数 的 稳健 性 ， 通 过 记录 边界 的 步 数 来 确保 在 超出 一 定 限 制 前 放弃 递 
jao (在 13.3 节 ， 我 们 会 看 到 另 一 种 探测 数据 结构 是 否 存 在 环 的 技术 。) 


12.4. 示例 : 编码 S 表 达 式 


Display 是 一 个 用 于 显示 结构 化 数据 的 调试 工具 ， 但 是 它 并 不 能 将 任意 的 Go 语言 对 象 编码 为 通 
用 消息 然后 用 于 进程 间 通 信 。 

正如 我 们 在 4.5 节 中 中 看 到 的 ，Go 语 言 的 标准 库 支 持 了 包括 JSON、XML 和 ASN.1 等 多 种 编码 
格式 。 还 有 另 一 种 依然 被 广泛 使 用 的 格式 是 S 表 达 式 格式 ， 采 用 类 似 Lisp 语 言 的 语法 。 但 是 和 
其 他 编码 格式 不 同 的 是 ，Go 语 言 自 带 的 标准 库 并 不 支持 S 表 达 式 ， 主 要 是 因为 它 没有 一 个 公 

认 的 标准 规范 。 


在 本 节 中 ， 我 们 将 定义 一 个 包 用 于 将 Go 语言 的 对 象 编码 为 S 表 达 式 格式 ， 它 支持 以 下 结构 : 


42 Integer 

"hello" string (with Go-style quotation) 

foo symbol (an unquoted name) 

(1 2 3) list (zero or more items enclosed in parentheses) 


布尔 型 习惯 上 使 用 t 符 号 表示 true， 空 列表 或 nil 符 号 表示 人 false， 但 是 为 了 简单 起 见 ， 我 们 暂时 
忽略 布尔 类 型 。 同 时 忽略 的 还 有 chan 管 道 和 函数 ， 因 为 通过 反射 并 无 法 知道 它们 的 确切 状 
态 。 我 们 忽略 的 还 浮 点 数 、 复 数 和 interface 。 支 持 它们 是 练习 12.3 的 任务 。 


我 们 将 Go 语言 的 类 型 编码 为 S 表 达 式 的 方法 如 下 。 整 数 和 字符 串 以 自然 的 方式 编码 。Nil 值 编 
码 为 nil 符 号 。 数 组 和 slice 被 编码 为 一 个 列表 。 


结构 体 被 编码 为 成 员 对 象 的 列表 ， 每 个 成 员 对 象 对 应 一 个 个 仅 有 两 个 元 素 的 子 列表 ， 其 中 子 
列表 的 第 一 个 元 素 是 成 员 的 名 字 ， 子 列表 的 第 二 个 元 素 是 成 员 的 值 。Map 被 编码 为 键 值 对 的 
列表 。 传 统 上 ，S 表 达 式 使 用 点 状 符号 列表 (key . value) 结 构 来 表示 key/value 对 ， 而 不 是 用 一 
个 含 双 元 素 的 列表 ， 不 过 为 了 简单 我 们 忽略 了 点 状 符号 列表 。 


编码 是 由 一 个 encode 递 归 郊 数 完成 ， 如 下 所 示 。 它 的 结构 本 质 上 和 前 面 的 Display 元 数 类 似 : 
gopl.io/ch12/sexpr 


func encode(buf *bytes.Buffer, v reflect.Value) error { 
switch v.Kind() { 
case reflect.Invalid: 
buf .WriteString("nil") 


case reflect.Int, reflect.Int8, reflect.Int16, 
reflect.Int32, reflect.Int64: 
fmt.Fprintf (buf, "%d", v.Int()) 


case reflect.Uint, reflect.Uint8, reflect.Uinti6, 
reflect.Uint32, reflect.Uint64, reflect.Uintptr: 
fmt.Fprintf (buf, "%d", v.Uint()) 


case reflect.String: 
fmt.Fprintf(buf, "%q", v.String()) 


case reflect.Ptr: 
return encode(buf, v.Elem()) 


case reflect.Array, reflect.Slice: // (value ...) 
buf .WriteByte('(') 
for i := 0; i < v.Len(); it+ { 
ifi>of 
buf.WriteByte(' ') 
} 
if err := encode(buf, v.Index(i)); err != nil { 
return err 


} 
buf .WriteByte(')') 


case reflect.Struct: // ((name value) ...) 
buf .WriteByte('(') 
for i := 0; i < v.NumField(); i++ { 
chip 3 (0) <f 
buf .WriteByte(' ') 
} 
fmt.Fprintf (buf, "(%s ", v.Type().Field(i).Name) 
if err := encode(buf, v.Field(i)); err != nil { 
return err 
} 
buf .WriteByte(')') 


} 
buf .WriteByte(')') 


case reflect.Map: // ((key value) ...) 
buf .WriteByte('(') 
for i, key := range v.MapKeys() { 
ifi>of 
buf.WriteByte(' ') 


} 

buf .WriteByte('(') 

if err := encode(buf, key); err != nil { 
return err 

} 

buf .WriteByte(' ') 

if err := encode(buf, v.MapIndex(key)); err != nil { 
return err 

} 


buf .WriteByte(')') 


} 
buf .WriteByte(')') 


default: // float, complex, bool, chan, func, interface 
return fmt.Errorf("unsupported type: %s", v.Type()) 


} 


return nil 


Marshal 函 数 是 对 encode 的 保证 ， 以 保持 和 encoding/... 下 其 它 包 有 着 相似 的 API : 


// Marshal encodes a Go value in S-expression form. 


func Marshal(v interface{}) ([]byte, error) { 
var buf bytes.Buffer 
if err := encode(&buf, reflect.ValueOf(v)); err != nil { 
return nil, err 


} 
return buf.Bytes(), nil 


下 面 是 Marshal 对 12.3 节 的 strangelove 变 量 编码 后 的 结果 : 


((Title "Dr. Strangelove") (Subtitle "How I Learned to Stop Worrying and Lo 
ve the Bomb") (Year 1964) (Actor (("Grp. Capt. Lionel Mandrake" "Peter Sell 
ers") ("Pres. Merkin Muffley" "Peter Sellers") ("Gen. Buck Turgidson" "Geor 
ge C. Scott") ("Brig. Gen. Jack D. Ripper" "Sterling Hayden") ("Maj. T.J. N 
"King\" Kong" "Slim Pickens") ("Dr. Strangelove" "Peter Sellers"))) (Oscars 
("Best Actor (Nomin.)" "Best Adapted Screenplay (Nomin.)" "Best Director (N 
omin.)" "Best Picture (Nomin.)")) (Sequel nil) ) 


整个 输出 编码 为 一 行 中 以 减少 输出 的 大 小 ， 但 是 也 很 难 阅 读 。 这 里 有 一 个 对 S 表 达 式 格式 化 的 
约定 。 编 写 一 个 S 表 达 式 的 格式 化 函数 将 作为 一 个 具有 挑战 性 的 练习 任务 ; 不 过 http://gopl.io 
也 提供 了 一 个 简单 的 版 本 。 


((Title "Dr. Strangelove") 

(Subtitle "How I Learned to Stop Worrying and Love the Bomb") 

(Year 1964) 

(Actor (("Grp. Capt. Lionel Mandrake" "Peter Sellers") 
("Pres. Merkin Muffley" "Peter Sellers") 
("Gen. Buck Turgidson" "George C. Scott") 
("Brig. Gen. Jack D. Ripper" "Sterling Hayden") 
("Maj. T.J. \"King\" Kong" "Slim Pickens") 
("Dr. Strangelove" "Peter Sellers"))) 

(Oscars ("Best Actor (Nomin.)" 
"Best Adapted Screenplay (Nomin.)" 
"Best Director (Nomin.)" 
"Best Picture (Nomin. )")) 

(Sequel nil)) 
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入 死 循环 。 


在 12.6 节 中 ， 我 们 将 给 出 S 表 达 式 解码 器 的 实现 步骤 ， 但 是 在 那 之 前 ， 我 们 还 需要 先 了 解 如 果 
通过 反射 技术 来 更 新 程序 的 变量 。 


练习 12.3: 实现 encode 函 数 缺 少 的 分 支 。 将 布尔 类 型 编码 为 t 和 nil， 浮 点 数 编码 为 Go 语言 的 
格式 ， 复 数 1+2i 编 码 为 #C(1.0 2.0) 格 式 。 接 口 编 码 为 类 型 名 和 值 对 ， 例 如 ("[jint" (1 2 3))， 但 
是 这 个 形式 可 能 会 造成 歧义 : reflect.Type.String 方 法 对 于 不 同 的 类 型 可 能 返回 相同 的 结果 。 


练习 12.4: 修改 encode 郊 数 ， 以 上 面 的 格式 化 形式 输出 S 表 达 式 。 


练习 12.5: 修改 encode 有 函数 ， 用 JSON 格 式 代替 S 表 达 式 格式 。 然 后 使 用 标准 库 提 供 的 
json.Unmarshal 解 码 器 来 验证 函数 是 正确 的 。 


练习 12.6 : 修改 encode， 作 为 一 个 优化 ， 和 忽略 对 是 零 值 对 象 的 编码 。 


练习 12.7 : 创建 一 个 基于 流 式 的 API， 用 于 S 表 达 式 的 解码 ， 和 json.Decoder(S4.5) 有 函数 功能 


类 似 。 


12.5. 通过 reflect.Value 修 改 值 


到 目前 为 止 ， 反 射 还 只 是 程序 中 变量 的 另 一 种 访问 方式 。 然 而 ， 在 本 节 中 我 们 将 重点 讨论 如 
果 通 过 反射 机 制 来 修改 变量 。 

回想 一 下 ，Go 语 言 中 类 似 x、X.f[1] 和 *p 形 式 的 表达 式 都 可 以 表示 变量 ， 但 是 其 它 如 x + 1 和 f(2) 
则 不 是 变量 。 一 个 变量 就 是 一 个 可 寻 址 的 内 存 空 间 ， 里 面 存 储 了 一 个 值 ， 并 且 存 储 的 值 可 以 
通过 内 存 地 址 来 更 新 。 


对 于 reflect.Values 也 有 类 似 的 区 别 。 有 一 些 reflect.Values 是 可 取 地 址 的 ; 其 它 一 些 则 不 可 
以 。 考 虑 以 下 的 声明 语 名 : 


x := 2 // value type variable? 
a := reflect.ValueOf(2) // 2 int no 

b := reflect.ValueOf(x) // 2 int no 

c := reflect.ValueOf(&x) // &x Same C 

d := c.Elem() pif 22 int yes (x) 


其 中 a 对 应 的 变量 则 不 可 取 地 址 。 因 为 a 中 的 值 仅 仅 是 整数 2 的 拷贝 副本 。b 中 的 值 也 同样 不 可 
取 地 址 。C 中 的 值 还 是 不 可 取 地 址 ， 它 只 是 一 个 指针 gx 的 拷贝 。 实 际 上 ， 所 有 通过 
reflect.ValueOf(x) 返 回 的 reflect.Value 都 是 不 可 取 地 址 的 。 但 是 对 于 d， 它 是 c 的 解 引 用 方式 生 
成 的 ， 指 向 另 一 个 变量 ， 因 此 是 可 取 地 址 的 。 我 们 可 以 通过 调用 reflect.ValueOf(&x).Elem()， 
来 获取 任意 变量 x 对 应 的 可 取 地 址 的 Value © 


我 们 可 以 通过 调用 reflect.Value 的 CanAddr 方 法 来 判断 其 是 否 可 以 被 取 地 址 : 


fmt.Println(a.CanAddr()) // "false" 
fmt.Println(b.CanAddr()) // "false" 
fmt.Println(c.CanAddr()) // "false" 
fmt.Println(d.CanAddr()) // "true" 


每 当 我 们 通过 指针 间接 地 获取 的 reflect.Value 都 是 可 取 地 址 的 ， 即 使 开始 的 是 一 个 不 可 取 地 址 
的 Value。 在 反射 机 制 中 ， 所 有 关于 是 否 支 持 取 地 址 的 规则 都 是 类 似 的 。 例 如 ，slice 的 索引 表 
达 式 e 四 将 隐 式 地 包含 一 个 指针 ， 它 就 是 可 取 地 址 的 ， 即 使 开始 的 6 表达 式 不 支持 也 没有 关系 。 
以 此 类 推 ，reflect.ValueOf(e).Index(i) 对 于 的 值 也 是 可 取 地 址 的 ， 即 使 原始 的 
reflect.ValueOf(e) 不 支持 也 没有 关系 。 


要 从 变量 对 应 的 可 取 地 址 的 reflect.Value 来 访问 变量 需要 三 个 步骤 。 第 一 步 是 调用 Addr() 方 
法 ， 它 返回 一 个 Value， 里 面 保存 了 指向 变量 的 指针 。 然 后 是 在 Value 上 调用 Interface() 方 法 ， 
也 就 是 返回 一 个 interface{}， 里 面 通用 包含 指向 变量 的 指针 。 最 后 ， 如 果 我 们 知道 变量 的 类 
型 ， 我 们 可 以 使 用 类 型 的 断言 机 制 将 得 到 的 interface{} 类 型 的 接口 强制 环 为 普通 的 类 型 指针 。 
这 样 我 们 就 可 以 通过 这 个 普通 指针 来 更 新 变量 了 : 


x := 2 


d := reflect.ValueOf (&x).Elem() // d refers to the variable x 
px := d.Addr().Interface().(*int) // px := &x 

DX = 3 // xX =83 

fmt .Println(x) Wak MEM 


或 者 ， 不 使 用 指针 ， 而 是 通过 调用 可 取 地 址 的 reflect.Value 的 reflect.Value.Set 方 法 来 更 新 对 于 
的 值 : 


d.Set(reflect,.Valueof(4)) 
fmt.Println(x) // "4" 


Set 方 法 将 在 运行 时 执行 和 编译 时 类 似 的 可 赋值 性 约束 的 检查 。 以 上 代码 ， 变 量 和 值 都 是 int 类 
型 ， 但 是 如 果 变 量 是 int64 类 型 ， 那 么 程序 将 抛 出 一 个 panic 红 常 ， 所 以 关键 问题 是 要 确保 改 类 
型 的 变量 可 以 接受 对 应 的 值 : 


d.Set(reflect.ValueOf(int64(5))) // panic: int64 is not assignable to int 
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X= 二 3 之 
b := reflect.ValueOf (x) 
b.Set(reflect.ValueOf(3)) // panic: Set using unaddressable value 


这 里 有 很 多 用 于 基本 数据 类 型 的 Set 方 法 : Setlnt、SetUint、SetString 和 SetFloat 等 。 


d := reflect.ValueOf(&x).Elem() 
d.SetInt(3) 
fmt.Println(x) // "3" 


写 


从 某 种 程度 上 说 ， 这 些 Set 方 法 总 是 尽 可 能 地 完成 任务 。 以 Setlnt 为 例 ， 只 要 变量 是 某 种 类 型 
的 有 符号 整数 就 可 以 工作 ， 即 使 是 一 些 命名 的 类 型 ， 只 要 底层 数据 类 型 是 有 符号 整数 就 可 
以 ， 而 且 如 果 对 于 变量 类 型 值 太 大 的 话 会 被 自动 截断 。 但 需要 说 惯 的 是 : 对 于 一 个 引用 
interface{f} 类 型 的 reflect.Value 调 用 Setlnt 会 导致 panic 异 常 ， 即 使 那个 interface 人 } 变 量 对 于 整数 
类 型 也 不 行 。 


rx := reflect.ValueOf(&x).Elem() 


rx.SetInt(2) // OK, X = 2 
rx.Set(reflect.ValueOf(3)) // OK, xX = 3 
rx.SetString("hello") // panic: string is not assignable to int 


rx.Set(reflect.ValueOf("hello")) // panic: string is not assignable to int 


var y interface{} 
ry := reflect.ValueOf (&y) .Elem() 


ry.SetInt(2) // panic: SetInt called on interface Value 
ry.Set(reflect.ValueOf (3) ) // OK, y = int(3) 
ry.SetString("hello") // panic: SetString called on interface Value 


ry.Set(reflect.ValueOf("hello")) // OK, y = "hello" 


当 我 们 用 Display 显 示 os.Stdout 结 构 时 ， 我 们 发 现 反射 可 以 越过 Go 语言 的 导出 规则 的 限制 读 取 
结构 体 中 未 导出 的 成 员 ， 比 如 在 类 Unix 系 统 上 os.File 结 构 体 中 的 fd int 成 员 。 然 而 ， 利 用 反射 
机 制 并 不 能 修改 这 些 未 导出 的 成 员 : 


stdout := reflect.ValueOf(os.Stdout).Elem() // *os.Stdout, an os.File var 
fmt .Println(stdout.Type() ) // “os.Filie" 

fd := stdout.FieldByName("fd') 

fmt.Printin(fd.Int()) // "i" 

fd.SetInt(2) // panic: unexported field 


一 个 可 取 地 址 的 reflect.Value 会 记录 一 个 结构 体 成 员 是 否 是 未 导出 成 员 ， 如 果 是 的 话 则 拒绝 修 
改 操作 。 因 此 ，CanAddr 方 法 并 不 能 正确 反映 一 个 变量 是 否 是 可 以 被 修改 的 。 另 一 个 相关 的 
方法 CanSet 是 用 于 检查 对 应 的 reflect.Value 是 否 是 可 取 地 址 并 可 被 修改 的 : 


fmt.Println(fd.CanAddr(), fd.CanSet()) // "true false" 


12.6. 示例 : 解码 S 表 达 式 


标准 库 中 encoding/... 下 每 个 包 中 提供 的 Marshal 编 码 函 数 都 有 一 个 对 应 的 Unmarshal 函 数 用 于 
解码 。 例 如 ， 我 们 在 4.5 节 中 看 到 的 ， 要 将 包含 JSON 编 码 格 式 的 字 节 gslice 数 据 解码 为 我 们 自 
己 的 Movie 类 型 (§12.3) ， 我 们 可 以 这 样 做 : 


data := []byte{/* ... */} 
var movie Movie 
err := json.Unmarshal(data, &movie) 


Unmarshal % žit M T RAt atl RAF movie SBD MK > HAE HAH ASA Movie ii 
创建 对 应 的 map、 结 构 体 和 slice。 


现在 让 我 们 为 S 表 达 式 编码 实现 一 个 简易 的 Unmarshal， 类 似 于 前 面 的 json.Unmarshal 标 准 库 
函数 ， 对 应 我 们 之 前 实现 的 sexprMarshal 函 数 的 逆 操作 。 我 们 必须 提醒 一 下 ， 一 个 健壮 的 和 
通用 的 实现 通常 需要 比例 子 更 多 的 代码 ， 为 了 便于 演示 我 们 采用 了 精简 的 实现 。 我 们 只 支持 S 
表达 式 有 限 的 子 集 ， 同 时 处 理 错误 的 方式 也 比较 粗暴 ， 代 码 的 目的 是 为 了 演示 反射 的 用 法 ， 
而 不 是 构造 一 个 实用 的 S 表 达 式 的 解码 器 。 


词法 分 析 器 lexer 使 用 了 标准 库 中 的 text/scanner 包 将 输入 流 的 字 节 数据 解析 为 一 个 个 类 似 注 
释 、 标 识 符 、 字 符 串 面值 和 数字 面值 之 类 的 标记 。 输 入 扫描 器 scanner 的 Scan 方法 将 提前 扫描 
和 返回 下 一 个 记号 ， 对 于 rune 类 型 。 大 多 数 记 号 ， 比 如 "(”， 对 应 一 个 单一 rune 可 表示 的 
Unicode 字 符 ， 但 是 text/scanner 也 可 以 用 小 的 负数 表示 记号 标识 符 、 字 符 串 等 由 多 个 字符 组 
成 的 记号 。 调 用 Scan 方法 将 返回 这 些 记 号 的 类 型 ， 接 着 调用 TokenText 方 法 将 返回 记号 对 应 的 


因为 每 个 解析 器 可 能 需要 多 次 使 用 当前 的 记号 ， 但 是 Scan 会 一 直 向 前 扫描 ， 所 有 我 们 包装 了 
一 个 lexer 扫 描 器 辅助 类 型 ， 用 于 跟踪 最 近 由 Scan 方法 返回 的 记号 。 


gopl.io/ch12/sexpr 


type lexer struct { 
scan scanner.Scanner 
token rune // the current token 


func (lex *lexer) next() { lex.token = lex.scan.Scan() } 
func (lex *lexer) text() string { return lex.scan.TokenText() } 


func (lex *lexer) consume(want rune) { 
if lex.token != want { // NOTE: Not an example of good error handling. 
panic(fmt.Sprintf("got %q, want %q", lex.text(), want)) 
} 


lex.next() 


现在 让 我 们 转 到 语法 解析 器 。 它 主要 包含 两 个 功能 。 第 一 个 是 read 函 数 ， 用 于 读 取 S 表 达 式 的 
当前 标记 ， 然 后 根据 S 表 达 式 的 当前 标记 更 新 可 取 地 址 的 reflect.Value 对 应 的 变量 Vv。 


func read(lex *lexer, v reflect.Value) { 
switch lex.token { 
case scanner.Ident: 
// The only valid identifiers are 
// “nil" and struct field names. 
if lex.text() == "nil" { 
v.Set(reflect.Zero(v.Type())) 
lex.next() 
return 
} 
case scanner.String: 
s, _ := strconv.Unquote(lex.text()) // NOTE: ignoring errors 
v.SetString(s) 
lex.next() 
return 
case Scanner .Int : 
i, _ := strconv.Atoi(lex.text()) // NOTE: ignoring errors 
v.SetInt(int64(i) ) 
lex.next() 
return 
case (4: 
lex.next() 
readList(lex, v) 
lex.next() // consume ')' 
return 


} 
panic(fmt.Sprintf("unexpected token %q", lex.text())) 


我 们 的 S 表 达 式 使 用 标识 符 区 分 两 个 不 同类 型 ， 结 构 体 成 员 名 和 nil 值 的 指针 。read 函 数值 处 理 
nil 类 型 的 标识 符 。 当 遇 到 scannerldent 为 “ni 让 是， 使 用 reflect.Zero 有 函数 将 变量 v 设 置 为 零 值 。 
而 其 它 任何 类 型 的 标识 符 ， 我 们 都 作为 错误 处 理 。 后 面 的 readList 函 数 将 处 理 结构 体 的 成 员 

名 。 


一 个 “(标记 对 应 一 个 列表 的 开始 。 第 二 个 函数 readList， 将 一 个 列表 解码 到 一 个 聚合 类 型 中 
(map、 结 构 体 、slice 或 数组 ) ， 具 体 类 型 依然 于 传 入 待 填充 变量 的 类 型 。 每 次 遇 到 这 种 情 
况 ， 循 环 继续 解析 每 个 元 素 直 到 遇 到 于 开始 标记 匹配 的 结束 标记 “")”，endList 函 数 用 于 检测 结 
束 标 记 。 


最 有 趣 的 部 分 是 递归 。 最 简单 的 是 对 数组 类 型 的 处 理 。 直 到 遇 到 “)" 结 束 标 记 ， 我 们 使 用 Index 
函数 来 获取 数组 每 个 元 素 的 地 址 ， 然 后 递归 调用 read 函 数 处 理 。 和 其 它 错 误 类 似 ， 如 果 输 入 

数据 导致 解码 器 的 引用 超出 了 数组 的 范围 ， 解 码 器 将 抛 出 panic 异 常 。slice 也 采用 类 似 方法 解 
析 ， 不 同 的 是 我 们 将 为 每 个 元 素 创建 新 的 变量 ， 然 后 将 元 素 添加 到 slice 的 末尾 。 


在 循环 处 理 结构 体 和 map 每 个 元 素 时 必须 解码 一 个 (key value) 格 式 的 对 应 子 列 表 。 对 于 结构 
体 ，key 部 分 对 于 成 员 的 名 字 。 和 数组 类 似 ， 我 们 使 用 FieldByName 找 到 结构 体 对 应 成 员 的 变 
量 ， 然 后 递归 调用 read 函 数 处 理 。 对 于 map，key 可 能 是 任意 类 型 ， 对 元 素 的 处 理 方式 和 slice 
类 似 ， 我 们 创建 一 个 新 的 变量 ， 然 后 递归 填充 它 ， 最 后 将 新 解析 到 的 key/value 对 添加 到 

map ° 


func readList(lex *lexer, v reflect.Value) { 
switch v.Kind() { 
case reflect.Array: // (item ...) 
for i := 0; !endList(lex); i++ { 
read(lex, v.Index(i)) 


} 


case reflect.Slice: // (item ...) 
for !endList(lex) { 
item := reflect.New(v.Type().Elem()).Elem() 
read(lex, item) 
v.Set(reflect.Append(v, item) ) 
} 


case reflect.Struct: // ((name value) ...) 
for tendList(lex) { 
lex.consume('(') 
if lex.token != scanner.Ident { 
panic(fmt.Sprintf("got token %q, want field name", lex.text())) 


} 
name := lex.text() 
lex.next() 


read(lex, v.FieldByName(name) ) 
lex.consume(')') 


} 


case reflect.Map: // ((key value) ...) 


v.Set(reflect .MakeMap(v.Type())) 
for !tendList(lex) { 
lex.consume('(') 
key := reflect.New(v.Type().Key()).Elem() 
read(lex, key) 
value := reflect.New(v.Type().Elem()).Elem() 
read(lex, value) 
v.SetMapIndex(key, value) 
lex.consume(')') 


default: 
panic(fmt.Sprintf("cannot decode list into %v", v.Type())) 


func endList(lex *lexer) bool { 
switch lex.token { 
case Scanner .EOF: 
panic("end of file") 
case ')!': 
return true 


} 


return false 


最 后 ， 我 们 将 解析 器 包装 为 导出 的 Unmarshal 解 码 函 数 ， 隐 藏 了 一 些 初 始 化 和 清理 等 边缘 处 
理 。 内 部 解析 器 以 panic 的 方式 抛 出 错误 ， 但 是 Unmarshal 函 数 通 过 在 defer 语 句 调用 recover 声 
数 来 捕获 内 部 panic (§5.10) ， 然 后 返回 一 个 对 panic 对 应 的 错误 信息 。 


// Unmarshal parses S-expression data and populates the variable 
// whose address is in the non-nil pointer out. 
func Unmarshal(data []byte, out interface{}) (err error) { 
lex := &lexer{scan: scanner.Scanner{Mode: scanner .GoTokens}} 
lex.scan.Init(bytes.NewReader (data) ) 
lex.next() // get the first token 
defer func() { 
// NOTE: this is not an example of ideal error handling. 
if x := recover(); x != nil { 
err = fmt.Errorf("error at %s: %v", lex.scan.Position, x) 


}() 
read(lex, reflect.Valueof(out).Elem()) 
return nil 


生产 实现 不 应 该 对 任何 输入 问题 都 用 panic 形 式 报告 ， 而 且 应 该 报告 一 些 错误 相关 的 信息 ， 例 
如 出 现 错 误 输 入 的 行 号 和 位 置 等 。 尺 管 如 此 ， 我 们 希望 通过 这 个 例子 来 展示 类 似 
encoding/json 包 底 层 代 码 的 实现 思路 ， 以 及 如 何 使 用 反射 机 制 来 填充 数据 结构 。 


练习 12.8: sexprUnmarshal 函 数 和 json.Unmarshal 一 样 ， 都 要 求 在 解码 前 输入 完整 的 字 节 
slice。 定 义 一 个 和 json.Decoder 类 似 的 sexprDecoder 类 型 ， 支 持 从 一 个 io.Reader 流 解码 。 修 
改 sexpr.Unmarshal 元 数 ， 使 用 这 个 新 的 类 型 实现 。 


练习 12.9: 编写 一 个 基于 标记 的 API 用 于 解码 S 表 达 式 ， 参 考 xml.Decoder (7.14) 的 风格 。 
你 将 需要 五 种 类 型 的 标记 : Symbol、String、Int、StartList 和 EndList。 


练习 12.10 : 4 esexpr.Unmarshal 82k > X45 4 RA! ` FF RR Frinterface K H 49 MAY > 18 
练习 12.3 : 的 方案 。 (提示 : 要 解码 接口 ， 你 需要 将 name 了 映射 到 每 个 支持 类 型 的 
reflect.Type ° ) 


12.7. 获取 结构 体 字 段 标识 


在 4.5 节 我 们 使 用 构 体 成 员 标签 用 于 设置 对 应 JSON 对 应 的 名 字 。 其 中 json 成 员 标 签 让 我 们 可 以 
选择 成 员 的 名 字 和 抑制 零 值 成 员 的 输出 。 在 本 节 ， 我 们 将 看 到 如 果 通 过 反射 机 制 类 获取 成 员 


对 于 一 个 web 服 务 ， 大 部 分 HTTP 处 理 函 数 要 做 的 第 一 件 事情 就 是 展开 请 求 中 的 参数 到 本 地 变 
量 中 。 我 们 定义 了 一 个 工具 函数 ， 叫 params.Unpack， 通 过 使 用 结构 体 成 员 标 签 机 制 来 让 
HTTP 处 理 函 数 解 析 请 求 参 数 更 方便 。 


首先 ， 我 们 看 看 如 何 使 用 它 。 下 面 的 search 兄 数 是 一 个 HTTP 请 求 处 理 函 数 。 它 定义 了 一 个 基 
名 结构 体 类 型 的 变量 ， 用 结构 体 的 每 个 成 员 表 示 HTTP 请 求 的 参数 。 其 中 结构 体 成 员 标 签 指明 
了 对 于 请 求 参 数 的 名 字 ， 为 了 减少 URL 的 长 度 这 些 参数 名 通常 都 是 神秘 的 缩 略 词 。Unpack 将 
请 求 参 数 填 充 到 合适 的 结构 体 成 员 中 ， 这 样 我 们 可 以 方便 地 通过 合适 的 类 型 类 来 访问 这 些 参 

数 。 


gopl.io/ch12/search 


import "gopl.io/chi2/params" 


// search implements the /search URL endpoint 
func search(resp http.Responsewriter, req *http.Request) { 
var data struct { 


Labels []string “http:"1"" 
MaxResults int “http: "max"~ 
Exact bool heene x 

} 

data.MaxResults = 10 // set default 

if err := params.Unpack(req, &data); err != nil { 
http.Error(resp, err.Error(), http.StatusBadRequest) // 400 
return 

} 

A eS CO MN and Ee ne: 


fmt.Fprintf(resp, "Search: %+v\n", data) 


下 面 的 Unpack 哆 数 主 要 完成 三 件 事情 。 第 一 ， 它 调用 req.ParseForm() 来 解析 HTTP 请 求 。 然 
后 ，req.Form 将 包含 所 有 的 请 求 参 数 ， 不 管 HTTP 客 户 端 使 用 的 是 GET 还 是 POST 请 求 方法 。 


下 一 步 ，Unpack 哆 数 将 构建 每 个 结构 体 成 员 有 效 参数 名 字 到 成 员 变 量 的 映射 。 如 果 结 构 体 成 
员 有 成 员 标 签 的 话 ， 有 效 参 数 名字 可 能 和 实际 的 成 员 名 字 不 相同 。reflect.Type 的 Field 方 法 将 
返回 一 个 reflect.StructField， 里 面 含有 每 个 成 员 的 名 字 、 类 型 和 可 选 的 成 员 标 签 等 信息 。 其 中 


成 员 标签 信息 对 应 reflect.StructTag 类 型 的 字符 囊 ， 并 且 提 供 了 Get 方 法 用 于 解析 和 根据 特定 
key 提 取 的 子 事 ， 例 如 这 里 的 http:"..." 形 式 的 子囊 。 


gopl.io/ch12/params 


// Unpack populates the fields of the struct pointed to by ptr 
// from the HTTP request parameters in req. 
func Unpack(req *http.Request, ptr interface{}) error { 
if err := req.ParseForm(); err != nil { 
return err 


// Build map of fields keyed by effective name. 
fields := make(map[string]reflect.Value) 
v := reflect.ValueOf(ptr).Elem() // the struct variable 


for i := 0; i < v.NumField(); i++ { 
fieldInfo := v.Type().Field(i) // a reflect.StructField 
tag := fieldInfo.Tag Maner Lect Ser ucelagd 


name := tag.Get("http") 
if name == "" { 
name = strings. ToLower(fieldInfo.Name) 


} 
fields[name] = v.Field(i) 


// Update struct field for each parameter in the request. 
for name, values := range req.Form { 
f := fields[name] 
if !f.IsValid() { 
continue // ignore unrecognized HTTP parameters 


} 
for _, value := range values { 
if f.Kind() == reflect.Slice { 
elem := reflect.New(f.Type().Elem()).Elem() 
if err := populate(elem, value); err != nil { 
return fmt.Errorf("%s: %v", name, err) 
} 
f.Set(reflect.Append(f, elem)) 
} else { 
if err := populate(f, value); err != nil { 
return fmt.Errorf("%s: %v", name, err) 
} 
} 
} 


} 


return nil 


最 后 ，Unpack 遍 历 HTTP 请 求 的 namey/valu 参 数 键 值 对 ， 并 且 根 据 更 新 相应 的 结构 体 成 员 。 回 
想 一 下 ， 同 一 个 名 字 的 参数 可 能 出 现 多 次 。 如 果 发 生 这 种 情况 ， 并 且 对 应 的 结构 体 成 员 是 
个 slice， 那 么 就 将 所 有 的 参数 添加 到 slice 中 。 其 它 情 况 ， 对 应 的 成 员 值 将 被 覆盖 ， 只 有 最 后 
一 次 出 现 的 参数 值 才 是 起 作用 的 。 


— 


populate 函 数 小 心 用 请 求 的 字符 串 类 型 参数 值 来 填充 单一 的 成 员 v (或 者 是 slice 类 型 成 员 中 的 
单一 的 元 素 ) 。 目 前 ， 它 仅 支持 字符 事 、 有 符号 整数 和 布尔 型 。 其 中 其 它 的 类 型 将 留 做 练习 
任务 。 


func populate(v reflect.Value, value string) error { 
switch v.Kind() { 
case reflect.String: 
v.SetString(value) 


case reflect.Int: 
i, err := strconv.ParseInt(value, 10, 64) 
if err != nil { 
return err 


} 
v.SetInt(i) 


case reflect.Bool: 
b, err := strconv.ParseBool(value) 
if err != nil { 
return err 


} 
v.SetBool(b) 


default: 
return fmt.Errorf("unsupported kind %s", v.Type()) 
} 


return nil 


如 果 我 们 上 上 面 的 处 理 程序 添加 到 一 个 Web 服务器 ， 则 可 以 产生 以 下 的 会 话 : 


$ go build gopl.io/chi2/search 

$ ./search & 

$ ./fetch 'http://localhost:12345/search' 

Search: {Labels:[] MaxResults:10 Exact: false} 

$ ./fetch 'http://localhost:12345/search?1=golang&l=programming' 
Search: {Labels:[golang programming] MaxResults:10 Exact: false} 

$ ./fetch 'http://localhost :12345/search?1l=golang&l=programming&max=100 ' 
Search: {Labels:[golang programming] MaxResults:100 Exact: false} 

$ ./fetch 'http://localhost:12345/search?x=true&l=golang&l=programming ' 
Search: {Labels:[golang programming] MaxResults:10 Exact: true} 

$ ./fetch 'http://localhost :12345/search?q=hello&x=123' 

x: strconv.ParseBool: parsing "123": invalid syntax 

$ ./fetch 'http://localhost:12345/search?q=hello&max=lots' 

max: strconv.ParseInt: parsing "lots": invalid syntax 


练习 12.11 : R E 7 BY Pack h žk ? 给 定 一 个 结构 体 值 ’ Pack h RSH T PFA ERK 
成 员 和 值 的 URL 。 


练习 12.12 扩展 成 员 标 签 以 表示 一 个 请 求 参 数 的 有 效 值 规则 o 例如 9 一 个 字符 串 可 以 是 有 
效 的 email 地 址 或 一 个 信用 卡号 码 ’ 还 有 一 个 整数 可 能 需要 是 有 效 的 邮政 编码 §kUnpack & 
数 以 检查 这 些 规 则 。 


练习 12.13 : 修改 S 表 达 式 的 编码 器 (S12.4) 和 解码 器 (§12.6) ， 采 用 和 encoding/json 包 
(§4.5) 类 似 的 方式 使 用 成 员 标 签 中 的 sexpr:"..." 字 囊 。 


12.8. 显示 一 个 类 型 的 方法 集 


我 们 的 最 后 一 个 例子 是 使 用 reflect.Type 来 打印 任意 值 的 类 型 和 枚 举 它 的 方法 : 


gopl.io/ch12/methods 


// Print prints the method set of the value x. 
func Print(x interface{}) { 
reflect .ValueOf (x) 


v.Type() 
fmt.Printf("type %s\n", t) 


Vv: 


t 


mole al 


:= 0; i < v.NumMethod(); i++ { 

methType := v.Method(i).Type() 

fmt.Printf("func (%s) %s%s\n", t, t.Method(i).Name, 
strings. TrimPrefix(methType.String(), "func")) 


reflect.Type 和 reflect.Value 都 提供 了 一 个 Method 方 法 。 每 次 tMethod(i) 调 用 将 一 个 
reflect.Method 的 实例 ， 对 应 一 个 用 于 描述 一 个 方法 的 名 称 和 类 型 的 结构 体 。 每 次 v.Method(i) 
方法 调用 都 返回 一 个 reflect.Value 以 表示 对 应 的 值 (§6.4) ， 也 就 是 一 个 方法 是 帮 到 它 的 接收 
者 的 。 使 用 reflect.Value.Call 方 法 (我们 之 类 没有 演示 ) ， 将 可 以 调用 一 个 Func 类 型 的 
Value， 但 是 这 个 例子 中 只 用 到 了 它 的 类 型 。 


这 是 属于 time.Duration 和 *strings.Replacer 两 个 类 型 的 方法 : 


methods.Print(time.Hour) 


Wh 
// 
Hi 
// 
// 
// 
// 


Ou 


tput: 


type time.Duration 


fu 
fu 
fu 
fu 





fu 


nc 
nc 
Nc 
nc 





nc 


( 


( 
( 
( 
( 


time. 
time. 
time. 
time. 
time. 


Duration 
Duration 
Duration 
Duration 
Duration 


) 
) 
) 
) 
) 


Hours() float64 
Minutes() float64 
Nanoseconds() int64 
Seconds() float64 
String() string 


methods.Print(new(strings.Replacer ) ) 
// Output: 
// type *strings.Replacer 


// func (*strings.Replacer) Replace(string) string 


// func (*strings.Replacer) WriteString(io.Writer, string) (int, error) 


457 


12.9. 几 点 忠告 


虽然 反射 提供 的 API 远 多 于 我 们 讲 到 的 ， 我 们 前 面 的 例子 主要 是 给 出 了 一 个 方向 ， 通 过 反射 可 
以 实现 哪些 功能 。 反 射 是 一 个 强大 并 富有 表达 力 的 工具 ， 但 是 它 应 该 被 小 心地 使 用 ， 原 因 有 


sae, 0 


第 一 个 原因 是 ， 基 于 反射 的 代码 是 比较 脆弱 的 。 对 于 每 一 个 会 导致 编译 器 报告 类 型 错误 的 问 
题 ， 在 反射 中 都 有 与 之 相对 应 的 问题 ， 不 同 的 是 编译 器 会 在 构建 时 马上 报告 错误 ， 而 反射 则 
是 在 丨 正 运行 到 的 时 候 才 会 抛 出 panic 出 常 ， 可 能 是 写 完 代码 很 久之 后 的 时 候 了 ， 而 且 程 序 也 
了 很 长 的 时 间 。 


= j> 


可 能 运 


以 前 面 的 readList 函 数 (812.6) 为 例 ， 为 了 从 输入 读 取 字 符 串 并 填充 int 类 型 的 变量 而 调用 的 
reflect.Value.SetString 方 法 可 能 导致 banic 异 常 。 绝 大 多 数 使 用 反射 的 程序 都 有 类 似 的 风险 ， 
需要 非常 小 心地 检查 每 个 reflect.Value 的 对 于 值 的 类 型 、 是 否 可 取 地 址 ， 还 有 是 否 可 以 被 修改 


KE 


=F ° 


避免 这 种 因 反 射 而 导致 的 脆弱 性 的 问题 的 最 好 方法 是 将 所 有 的 反射 相关 的 使 用 控制 在 包 的 内 
部 ， 如 果 可 能 的 话 避 免 在 包 的 API 中 直接 暴露 reflect.Value 类 型 ， 这 样 可 以 限制 一 些 非 法 输 
入 。 如 果 无 法 做 到 这 一 点 ， 在 每 个 有 风险 的 操作 前 指向 额外 的 类 型 检查 。 以 标准 库 中 的 代码 
为 例 ， 当 fmt.Printf 收 到 一 个 非法 的 操作 数 是 ， 它 并 不 会 抛 出 panic 异 常 ， 而 是 打印 相关 的 错误 
信息 。 程 序 虽然 还 有 BUG， 但 是 会 更 加 容易 诊断 。 


fmt.Printf("%d %s\n", "hello", 42) // "%!d(string=hello) %!s(int=42)" 


反射 同样 降低 了 程序 的 安全 性 ， 还 影响 了 自动 化 重 构 和 分 析 工 具 的 准确 性 ， 因 为 它们 无 法 识 
别 运 行 时 才能 确认 的 类 型 信息 。 


避免 使 用 反射 的 第 二 个 原因 是 ， 即 使 对 应 类 型 提供 了 相同 文档 ， 但 是 反射 的 操作 不 能 做 静态 
类 型 检查 ， 而 且 大 量 反射 的 代码 通常 难以 理解 。 总 是 需要 小 心 相 翼 地 为 每 个 导出 的 类 型 和 其 
它 接 受 interfacef{f} 或 reflect.Value 类 型 参数 的 函数 维护 说 明文 档 。 


第 三 个 原因 ， 基 于 反射 的 代码 通常 比 正常 的 代码 运行 速度 慢 一 到 两 个 数量 级 。 对 于 一 个 典型 
的 项 目 ， 大 部 分 函数 的 性 能 和 程序 的 整体 性 能 关系 不 大 ， 所 以 使 用 反射 可 能 会 使 程序 更 加 清 
晰 。 测 试 是 一 个 特别 适合 使 用 反射 的 场景 ， 因 为 每 个 测试 的 数据 集 都 很 小 。 但 是 对 于 性 能 关 
键 路 径 的 函数 ， 最 好 避免 使 用 反射 。 
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Go 语言 的 设计 包含 了 诸多 安全 策略 ， 限 制 了 可 能 导致 程序 运行 出 现 错误 的 用 法 。 编 译 时 类 型 
检查 检查 可 以 发 现 大 多 数 类 型 不 匹配 的 操作 ， 例 如 两 个 字符 串 做 减法 的 错误 。 字 符 串 、 
map、slice 和 chan 等 所 有 的 内 置 类 型 ， 都 有 严格 的 类 型 转换 规则 。 


对 于 无 法 静态 检测 到 的 错误 ， 例 如 数组 访问 越界 或 使 用 空 指针 ， 运 行 时 动态 检测 可 以 保证 程 
序 在 遇 到 问题 的 时 候 立 即 终止 并 打印 相关 的 错误 信息 。 自 动 内 存 管 理 (垃圾 内 存 自动 回收 ) 
可 以 消除 大 部 分 野 指 针 和 内 存 泄漏 相关 的 问题 。 


Go 语言 的 实现 刻意 隐藏 了 很 多 底层 细节 。 我 们 无 法 知道 一 个 结构 体 真 实 的 内 存 布 局 ， 也 无 法 
获取 一 个 运行 时 函数 对 应 的 机 器 码 ， 也 无 法 知道 当前 的 goroutine 是 运行 在 哪个 操作 系统 线程 
之 上 。 事 实 上 ，Go 语 言 的 调度 器 会 自己 决定 是 否 需要 将 某 个 goroutine 从 一 个 操作 系统 线程 转 
移 到 另 一 个 操作 系统 线程 。 一 个 指向 变量 的 指针 也 并 没有 展示 变量 监 实 的 地 址 。 因 为 垃圾 回 
收 器 可 能 会 根据 需要 移动 变量 的 内 存 位 置 ， 当 然 变量 对 应 的 地 址 也 会 被 自动 更 新 。 


总 的 来 说 ，Go 语 言 的 这 些 特性 使 得 Go 程序 相 比 较 低 级 的 C 语 言 来 说 更 容易 预测 和 理解 ， 程 序 
也 不 容易 崩溃 。 通 过 隐藏 底层 的 实现 细节 ， 也 使 得 Go 语言 编写 的 程序 具有 高 度 的 可 移植 性 ， 
因为 语言 的 语义 在 很 大 程度 上 是 独立 于 任何 编译 器 实现 、 操 作 系 统 和 CPU 系统 结构 的 〈 当 然 
也 不 是 完全 绝对 独立 : 例如 int 等 类 型 就 依赖 于 CPU 机 器 字 的 大 小 ， 某 些 表 达 式 求 值 的 具体 顺 
序 ， 还 有 编译 器 实现 的 一 些 额 外 的 限制 等 ) 。 


有 时 候 我 们 可 能 会 放弃 使 用 部 分 语言 特性 而 优先 选择 更 好 具有 更 好 性 能 的 方法 ， 例 如 需要 与 
其 他 语言 编写 的 库 互 操作 ， 或 者 用 纯 Go 语 言 无 法 实现 的 某 些 函数 。 


在 本 章 ， 我 们 将 展示 如 何 使 用 unsafe 包 来 摆脱 Go 语言 规则 带 来 的 限制 ， 讲 述 如 何 创建 C 语 言 
函数 库 的 绑 定 ， 以 及 如 何 进 行 系统 调用 。 


本 章 提供 的 方法 不 应 该 轻易 使 用 (译注 : 属于 黑 魔 法 ， 虽 然 可 能 功能 很 强大 ， 但 是 也 容易 误 
HEAL) 。 如 果 没 有 处 理 好 细节 ， 它 们 可 能 导致 各 种 不 可 预测 的 并 且 隐 蜀 的 错误 ， 其 至 连 
有 经 验 的 的 C 语 言 程序 员 也 无 法 理解 这 些 错误 。 使 用 unsafe 包 的 同时 也 放弃 了 Go 语言 保证 与 
未 来 版 本 的 兼容 性 的 承诺 ， 因 为 它 必 然 会 在 有 意 无 意 中 会 使 用 很 多 实现 的 细节 ， 而 这 些 实现 
的 细节 在 未 来 的 Go 语言 中 很 可 能 会 被 改变 。 


要 注意 的 是 ，unsafe 包 是 一 个 采用 特殊 方式 实现 的 包 。 虽 然 它 可 以 和 普通 包 一 样 的 导入 和 使 
用 ， 但 它 实 际 上 是 由 编译 器 实现 的 。 它 提供 了 一 些 访问 语言 内 部 特性 的 方法 ， 特 别 是 内 存 布 
局 相关 的 细节 。 将 这 些 特性 封装 到 一 个 独立 的 包 中 ， 是 为 在 极 少数 情况 下 需要 使 用 的 时 候 ， 
同时 引起 人 们 的 注意 (译注 : 因为 看 包 的 名 字 就 知道 使 用 unsafe 包 是 不 安全 的 ) 。 此 外 ， 有 
一 些 环 境 因为 安全 的 因素 可 能 限制 这 个 包 的 使 用 。 


包 
不 过 unsafe 包 被 广泛 地 用 于 比较 低级 的 包 , 例如 runtime、os、syscall 还 有 net 包 等 ， 因 为 它们 
需要 和 操作 系统 密切 配合 ， 但 是 对 于 普通 的 程序 一 般 是 不 需要 使 用 unsafe 包 的 。 
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13.1. unsafe.Sizeof, Alignof 和 Offsetof 


unsafe.Sizeof SRRAREREAGPH PPK Ds SRT REBRAHRAK EE 
并 不 会 对 表达 式 进行 求 值 。 一 个 Sizeof 函 数 调 用 是 一 个 对 应 uintptr 类 型 的 常量 表达 式 ， 因 此 返 
回 的 结果 可 以 用 作 数 组 类 型 的 长 度 大 小 ， 或 者 用 作 计 算 其 他 的 常量 。 


import "unsafe" 
fmt .Println(unsafe.Sizeof(float64(0))) // "8" 


Sizeof HAA EH) K+ RAS BE 25 HP EB > A] ho FAT HB at oe a A RP 89 48 Et OE 
串 长 度 部 分 ， 但 是 并 不 包含 指针 指向 的 字符 串 的 内 容 。Go 语 言 中 非 聚 合 类 型 通常 有 一 个 固定 
的 大 小 ， 尽 管 在 不 同 工 具 链 下 生成 的 实际 大 小 可 能 会 有 所 不 同 。 考 虑 到 可 移植 性 ， 引 用 类 型 
或 包含 引用 类 型 的 大 小 在 32 位 平台 上 是 4 个 字 节 ， 在 64 位 平台 上 是 8 个 字 节 。 


计算 机 在 加 载 和 保存 数据 时 ， 如 果 内 存 地 址 合理 地 对 齐 的 将 会 更 有 效率 。 例 如 2 字 节 大 小 的 
int16 类 型 的 变量 地 址 应 该 是 偶数 ， 一 个 4 字 节 大 小 的 rune 类 型 变量 的 地 址 应 该 是 4 的 倍数 ， 一 
个 8 字 节 大 小 的 float64、uint64 或 64-bit 指 针 类 型 变量 的 地 址 应 该 是 8 字 节 对 齐 的 。 但 是 对 于 再 
大 的 地 址 对 齐 倍数 则 是 不 需要 的 ， 即 使 是 complex128 等 较 大 的 数据 类 型 最 多 也 只 是 8 字 节 对 
齐 o 
由 于 地 址 对 齐 这 个 因素 ， 一 个 聚合 类 型 (结构 体 或 数组 ) 的 大 小 至 少 是 所 有 字段 或 元 素 大 小 
的 总 和 ， 或 者 更 大 因为 可 能 存在 内 存 空洞 。 内 存 空 洞 是 编译 器 自动 添加 的 没有 被 使 用 的 内 存 
空间 ， 用 于 保证 后 面 每 个 字段 或 元 素 的 地 址 相对 于 结构 或 数组 的 开始 地 址 能 够 合理 地 对 齐 
(译注 : 内 存 空 洞 可 能 会 存在 一 些 随 机 数据 ， 可 能 会 对 用 unsafe 包 直接 操作 内 存 的 处 理 产 生 


影响 ) 。 


类 型 大 小 
bool 1 个 字 节 
intN, uintN, floatN, complexN N/8 个 字 节 (例如 float64 是 8 个 字 节 ) 
int, uint, uintptr 1 个 机 器 字 
*T 1 个 机 器 字 
string 2 个 机 器 字 (data,len) 
IT 3 个 机 器 字 (data,len,cap) 
map 1 个 机 器 字 
func 1 个 机 器 字 
chan 1 个 机 器 字 


interface 2 个 机 器 字 (type,value) 


Go 语言 的 规范 并 没有 要 求 一 个 字段 的 声明 顺序 和 内 存 中 的 顺序 是 一 致 的 ， 所 以 理论 上 一 个 编 
译 器 可 以 随意 地 重新 排列 每 个 字段 的 内 存 位 置 ， 随 然 在 写作 本 书 的 时 候 编 译 器 还 没有 这 人 么 
做 。 下 面 的 三 个 结构 体 虽 然 有 着 相同 的 字段 ， 但 是 第 一 种 写法 比 另外 的 两 个 需要 多 50% 的 内 
o 


// 64-bit 32-bit 
struct{ bool; float64; int16 } // 3 words 4words 
struct{ float64; int16; bool } // 2 words 3words 
struct{ bool; int16; float64 } // 2 words 3words 


关于 内 存 地 址 对 章 算法 的 细节 超出 了 本 书 的 范围 ， 也 不 是 每 一 个 结构 体 都 需要 担心 这 个 问 
题 ， 不 过 有 效 的 包装 可 以 使 数据 结构 更 加 紧凑 《译注 : 未 来 的 Go 语言 编译 器 应 该 会 默认 优化 
结构 体 的 顺序 ， 当 然 用 于 应 该 也 能 够 指定 具体 的 内 存 布局 ， 相 同 讨论 请 参考 lssue10014 ) > 
内 存 使 用 率 和 性 能 都 可 能 会 受益 。 


unsafe.Alignof 均 数 返回 对 应 参数 的 类 型 需要 对 齐 的 倍数 . 和 Sizeof KRM, Alignof 也 是 返回 
一 个 常量 表达 式 , 对 应 一 个 常量 . 通常 情况 下 布尔 和 数字 类 型 需要 对 齐 到 它们 本 身 的 大 小 (最 多 
8 个 字 节 ), 其 它 的 类 型 对 齐 到 机 器 字 大 小 . 


unsafe.Offsetof 总数 的 参数 必须 是 一 个 字段 nin 
偏 移 量 , 包括 可 能 的 空洞 . 


,然后 返回 f 字段 相对 于 x 起 始 地 址 的 


图 13.1 显示 了 一 个 结构 体 变 量 x 以 及 其 在 32 位 和 64 位 机 器 上 的 典型 的 内 存 .灰色 区 域 是 空洞 . 


var x struct { 
a bool 
b int16 
c []int 


下 面 显 示 了 对 Xx 和 它 的 三 个 字段 调用 Unsafe 包 相关 函数 的 计算 结果 : 


c (data) 


c (len) 


c (cap) 





(32-bit) (64-bit) 
Figure 13.1. Holes ina struct. 


32 位 系统 : 


Sizeof (x) = 16 Alignof(x) = 
Sizeof(x.a) Alignof(x.a) 
Sizeof (x.b) Alignof (x.b) 
Sizeof(x.c) = 12 Alignof(x.c) = 


II 
N e 


Offsetof(x.a) = 0 
Offsetof(x.b) = 2 
Offsetof(x.c) = 4 


ll 
RNP A 


64 位 系统 : 


Sizeof (x) = 32 Alignof(x) 

Sizeof(x.a) Alignof(x.a) 
Sizeof (x.b) Alignof (x.b) 
Sizeof(x.c) = 24 Alignof(x.c) 


II 
N e 


Offsetof(x.a) = 0 
Offsetof(x.b) = 2 
Offsetof(x.c) = 8 


ll 
co N e © 


虽然 这 几 个 函数 在 不 


安全 的 Unsafe 包 ， 但 是 这 几 个 函数 调用 并 不 是 丨 的 不 安全 ， 特 别 在 需要 
优化 内 存 空间 时 它们 返回 


的 结果 对 于 理解 原生 的 内 存 布 局 很 有 帮助 。 


13.2. unsafe.Pointer 


大 多 数 指针 类 型 会 写成 *T ， 表 示 是 “一 个 指向 T 类 型 变量 的 指针 *。unsafe.Pointer 是 特别 定义 
的 一 种 指针 类 型 (译注 : 类 似 C 语 言 中 的 void* 类 型 的 指针 ) ， 它 可 以 包含 任意 类 型 变量 的 地 
址 。 当 然 ， 我 们 不 可 以 直接 通过 +p 来 获取 unsafe.Pointer 指 针 指 向 的 真实 变量 的 值 ， 因 为 我 

们 并 不 知道 变量 的 具体 类 型 。 和 普通 指针 一 样 ，unsafe.Pointer 指 针 也 是 可 以 比较 的 ， 并 且 支 
持 和 nil 常 量 比较 判断 是 否 为 空 指针 。 

一 个 普通 的 *T 类 型 指针 可 以 被 转化 为 unsafe.Pointer 类 型 指针 ， 并 且 一 个 unsafe.Pointer 类 型 
指针 也 可 以 被 转 回 普通 的 指针 ， 被 转 回 普通 的 指针 类 型 并 不 需要 和 原始 的 *T 类 型 相同 。 通 过 
将 *float64 类 型 指针 转化 为 *uint64 类 型 指针 ， 我 们 可 以 查看 一 个 浮 点 数 变量 的 位 模式 。 


package math 
func Float64bits(f float64) uint64 { return *(*uint64)(unsafe.Pointer(&f)) } 


fmt .Printf("%#016x\n", Float64bits(1.0)) // "Ox3ff0000000000000" 


通过 转 为 新 类 型 指针 ， 我 们 可 以 更 新 浮 点 数 的 位 模式 。 通 过 位 模式 操作 浮 点 数 是 可 以 的 ， 但 
是 更 重要 的 意义 是 指针 转换 语法 让 我 们 可 以 在 不 破坏 类 型 系统 的 前 提 下 向 内 存 写 入 任意 的 
值 。 


一 个 unsafe.Pointer 指 针 也 可 以 被 转化 为 uintptr 类 型 ， 然 后 保存 到 指针 型 数值 变量 中 (译注 : 
这 只 是 和 当前 指针 相同 的 一 个 数字 值 ， 并 不 是 一 个 指针 ) ， 然 后 用 以 做 必要 的 指针 数值 运 
算 。 (第 三 章 内 容 ，uintptr 是 一 个 无 符号 的 整 型 数 ， 足 以 保存 一 个 地 址 ) 这 种 转换 虽然 也 是 可 
逆 的 ， 但 是 将 uintptr 转 为 unsafe.Pointer 指 针 可 能 会 破坏 类 型 系统 ， 因 为 并 不 是 所 有 的 数字 都 
是 有 效 的 内 存 地 址 。 


许多 将 unsafe.Pointer 指 针 转 为 原生 数字 ， 然 后 再 转 回 为 Unsafe.Pointer 类 型 指针 的 操作 也 是 不 
安全 的 。 上 比如 下 面 的 例子 需要 将 变量 x 的 地 址 加 上 b 字 段 地 址 偏 移 量 转化 为 *int16 类 型 指针 ， 
然后 通过 该 指针 更 新 x.b : 


gopl.io/ch13/unsafeptr 


var x struct { 


a bool 
b int16 
c []int 
} 
// 4 pb := &X.b Ff 


pb := (*int16) (unsafe. Pointer ( 
uintptr(unsafe.Pointer(&x)) + unsafe.Offsetof(x.b))) 

*pb = 42 

fmt.Println(x.b) // "42" 


Lewy SRR SRE (ARERR E-HRS > AARKYA RE BRE BWA o FE 
试图 引入 一 个 uintptr 类 型 的 临时 变量 ， 因 为 它 可 能 会 破坏 代码 的 安全 性 (译注 : 这 是 真正 可 以 
体会 unsafe 包 为 何不 安全 的 例子 ) 。 下 面 段 代码 是 错误 的 : 


// NOTE: subtly incorrect! 

tmp := uintptr(unsafe.Pointer(&x)) + unsafe.Offsetof(x.b) 
pb := (*int16)(unsafe.Pointer(tmp) ) 

*pb = 42 


产生 错误 的 原因 很 微妙 。 有 时 候 垃 圾 回收 器 会 移动 一 些 变 量 以 降低 内 存 碎 片 等 问题 。 这 类 垃 

圾 回收 器 被 称 为 移动 GC。 当 一 个 变量 被 移动 ， 所 有 的 保存 改变 量 昌 地 址 的 指针 必须 同时 被 更 
新 为 变量 移动 后 的 新 地 址 。 从 垃圾 收集 器 的 视角 来 看 ， 一 个 unsafe.Pointer 是 一 个 指向 变量 的 
指针 ， 因 此 当 变 量 被 移动 是 对 应 的 指针 也 必须 被 更 新 ; 但 是 uintptr 类 型 的 临时 变量 只 是 一 个 普 
通 的 数字 ， 所 以 其 值 不 应 该 被 改变 。 上 面 错误 的 代码 因为 引入 一 个 非 指针 的 临时 变量 tmp， 导 
致 垃圾 收集 器 无 法 正确 识别 这 个 是 一 个 指向 变量 x 的 指针 。 当 第 二 个 语句 执行 时 ， 交 量 x 可 能 

已 经 被 转移 ， 这 时 候 临时 变量 tmp 也 就 不 再 是 现在 的 gx.b 地 址 。 第 三 个 向 之 前 无 效 地 址 空间 

的 赋值 语句 将 彻底 摧毁 整个 程序 ! 


还 有 很 多 类 似 原因 导致 的 错误 。 例 如 这 条 语句 : 


pT := uintptr(unsafe.Pointer(new(T))) // 提示 : 错误 | 


这 里 并 没有 指针 引用 new 新 创建 的 变量 ， 因 此 该 语句 执行 完成 之 后 ， 垃 圾 收集 器 有 权 马 上 回 
收 其 内 存 空间 ， 所 以 返回 的 pT 将 是 无 效 的 地 址 。 


虽然 目前 的 Go 语言 实现 还 没有 使 用 移动 GC (译注 : 未 来 可 能 实现 ) ， 但 这 不 该 是 编写 错误 代 
码 侥 在 的 理由 : 当前 的 Go 语言 实现 已 经 有 移动 变量 的 场景 。 在 5.2 节 我 们 提 到 goroutine 的 栈 是 
根据 需要 动态 增长 的 。 当 发 送 栈 动态 增长 的 时 候 ， 原 来 栈 中 的 所 以 变量 可 能 需要 被 移动 到 新 
的 更 大 的 栈 中 ， 所 以 我 们 并 不 能 确保 变量 的 地 址 在 整个 使 用 周期 内 是 不 变 的 。 


在 编写 本 文 时 ， 还 没有 清晰 的 原则 来 指引 Go 程序 员 ， 什 么 样 的 unsafe.Pointer 和 uintptr 的 转换 
是 不 安全 的 (参考 |lssue7192 ) .译注 : 该 问题 已 经 关闭 ) ， 因 此 我 们 强烈 建议 按照 最 坏 的 方 
式 处 理 。 将 所 有 和 包含 变量 地 址 的 uintptr 类 型 变量 当 作 BUG 处 理 ， 同 时 减少 不 必要 的 
unsafe.Pointer 类 型 到 uintptr 类 型 的 转换 。 在 第 一 个 例子 中 ， 有 三 个 转换 一 一 字段 偏 移 量 到 
uintptr 的 转换 和 和 转 回 unsafe.Pointer 类 型 的 操作 一 一 所 有 的 转换 全 在 一 个 表达 式 完成 。 


当 调用 一 个 库 函 数 ， 并 且 返 回 的 是 uintptr 类 型 地 址 时 (译注 : 普通 方法 实现 的 函数 不 尽量 不 要 
返回 该 类 型 。 下 面 例子 是 reflect 包 的 函数 ，reflect 包 和 unsafe 包 一 样 都 是 采用 特殊 技术 实现 

的 ， 编 译 器 可 能 给 它们 开 了 后 门 ) ， 比 如 下 面 反射 包 中 的 相关 函数 ， 返 回 的 结果 应 该 立即 转 
换 为 unsafe.Pointer 以 确保 指针 指向 的 是 相同 的 变量 。 


package reflect 


func (Value) Pointer() uintptr 
func (Value) UnsafeAddr() uintptr 
func (Value) InterfaceData() [2]uintptr // (index 1) 


13.3. 示例 : 深度 相等 判断 


来 自 reflect 包 的 DeepEqual 函 数 可 以 对 两 个 值 进行 深度 相等 判断 。DeepEqual 骂 数 使 用 内 建 的 
== 比 较 操作 符 对 基础 类 型 进行 相等 判断 ， 对 于 复合 类 型 则 递归 该 变量 的 每 个 基础 类 型 然后 做 
类 似 的 比较 判断 。 因 为 它 可 以 工作 在 任意 的 类 型 上 ， 甚 至 对 于 一 些 不 支持 == 操 作 运 算 符 的 类 
型 也 可 以 工作 ， 因 此 在 一 些 测 试 代码 中 广泛 地 使 用 该 函数 。 比 如 下 面 的 代码 是 用 DeepEqual 

函数 比较 两 个 字符 串 数 组 是 否 相等 。 


func TestSplit(t *testing.T) { 


got := strings.Split("a:b:c", ":") 
want := []string{"a", "b", "c"}; 
if !reflect.DeepEqual(got, want) { /* ... */ } 


R#DeepEqual HRA > HLTALLHERMHERA > CLERAREL o bdo > 
它 将 一 个 nil 值 的 map 和 非 nil 值 但 是 空 的 map 视 作 不 相等 ， 同 样 nil 值 的 slice 和 非 nil 但 是 空 的 
slice 也 视 作 不 相等 。 


var a, b []string = nil, []string{} 
fmt.Println(reflect.DeepEqual(a, b)) // "false" 


var c, d map[string]int = nil, make(map[string]int) 
fmt.Println(reflect.DeepEqual(c, d)) // "false" 


我 们 希望 在 这 里 实现 一 个 自己 的 Equal 函数 ， 用 于 比较 类 型 的 值 。 和 DeepEqual 函 数 类 似 的 地 
方 是 它 也 是 基于 slice 和 map 的 每 个 元 素 进行 递归 比较 ， 不 同 之 处 是 它 将 nil 值 的 slice (map ž% 
Ph) 和 非 nil 值 但 是 空 的 slice 视 作 相等 的 值 。 基 础 部 分 的 比较 可 以 基于 reflect 包 完成 ， 和 12.3 章 
的 Display 函 数 的 实现 方法 类 似 。 同 样 ， 我 们 也 定义 了 一 个 内 部 函数 equal， 用 于 内 部 的 递归 比 
较 。 读 者 目前 不 用 关心 seen 参 数 的 具体 含义 。 对 于 每 一 对 需要 比较 的 xX 和 y，equal 函 数 首 先 检 
测 它们 是 否 都 有 效 (或 都 无 效 ) ， 然 后 检测 它们 是 否 是 相同 的 类 型 。 剩 下 的 部 分 是 一 个 巨大 
的 switch 分 支 ， 用 于 相同 基础 类 型 的 元 素 比 较 。 因 为 页 面 空间 的 限制 ， 我 们 省 略 了 一 些 相似 的 
分 支 。 


gopl.io/ch13/equal 


func equal(x, y reflect.Value, seen map[comparison]bool) bool { 
if !x.IsValid() || !y.IsValid() { 
return x.IsValid() == y.IsValid() 
} 
if x.Type() != y.Type() { 
return false 


// ...cycle check omitted (shown later)... 


switch x.Kind() { 
case reflect.Bool: 

return x.Bool() == y.Bool() 
case reflect.String: 

return x.String() == y.String() 


// ...numeric cases omitted for brevity... 


case reflect.Chan, reflect.UnsafePointer, reflect.Func: 
return x.Pointer() == y.Pointer() 
case reflect.Ptr, reflect.Interface: 
return equal(x.Elem(), y.Elem(), seen) 
case reflect.Array, reflect.Slice: 
if x.Len() != y.Len() { 
return false 


} 
for = 0; 1 < x.Len(); i++ { 
if !equal(x.Index(i), y.Index(i), seen) { 
return false 
} 
} 


return true 


// ...Struct and map cases omitted for brevity... 


} 


panic("unreachable") 


和 前 面 的 建议 一 样 ， 我 们 并 不 公开 reflect 包 相关 的 接口 ， 所 以 导出 的 函数 需要 在 内 部 自己 将 变 
量 转 为 reflect.Value 类 型 。 


// Equal reports whether x and y are deeply equal. 
func Equal(x, y interface{}) bool { 
seen := make(map[comparison]bool) 
return equal(reflect.ValueOf(x), reflect.ValueOf(y), seen) 


type comparison struct { 
x, y unsafe.Pointer 
treflect.Type 


为 了 确保 算法 对 于 有 环 的 数据 结构 也 能 正常 退出 ， 我 们 必须 记录 每 次 已 经 比较 的 变量 ， 从 而 
避免 进入 第 二 次 的 比较 。Equal 函 数 分 配 了 一 组 用 于 比较 的 结构 体 ， 包 含 每 对 比较 对 象 的 地 址 

(unsafe.Pointer 形 式 保存 ) 和 类 型 。 我 们 要 记录 类 型 的 原因 是 ， 有 些 不 同 的 变量 可 能 对 应 相 
同 的 地 址 。 例 如 ， 如 果 X 和 y 都 是 数组 类 型 ， 那 么 x 和 x[0] 将 对 应 相同 的 地 址 ，y 和 y[0] 也 是 对 应 
相同 的 地 址 ， 这 可 以 用 于 区 分 x 与 y 之 间 的 比较 或 x[0] 与 y[0] 之 间 的 比较 是 否 进行 过 了 。 


// cycle check 
if x.CanAddr() && y.CanAddr() { 
xptr := unsafe.Pointer(x.UnsafeAddr() ) 
yptr := unsafe.Pointer(y.UnsafeAddr() ) 
if xptr == yptr { 
return true // identical references 
} 
c := comparison{xptr, yptr, x.Type()} 
if seen[c] { 
return true // already seen 


} 


seen[c] = true 


这 是 Equal 函数 用 法 的 例子 : 


fmt.Println(Equal([]Jint{i, 2, 3}, []Jint{i, 2, 3})) /Ue 
fmt.Println(Equal([]string{"foo"}, []string{"bar"})) V falses 
fmt.Println(Equal([]string(nil), []string{})) Lf enue! 


fmt .Println(Equal(map[string]int(nil), map[string]int{})) // "true" 


Equal 函数 甚至 可 以 处 理 类 似 12.3 章 中 导致 Display 陷 入 陷入 死 循 环 的 带 有 环 的 数据 。 


// Circular linked lists a -> b -> a andc ->c. 
type link struct { 

value string 

tail *link 
} 
a, b, c := &link{value: "a"}, &link{value: "b"}, &link{value: "c"} 
a.tail, b.tail, c.tail = b, a, c 
fmt.Println(Equal(a, a)) // "true" 
fmt.Println(Equal(b, b)) // "true" 
fmt.Println(Equal(c, c)) // "true" 
fmt.Println(Equal(a, b)) // "false" 
fmt.Println(Equal(a, c)) // "false" 


练习 13.1: 定义 一 个 深 比 较 函 数 ， 对 于 十 亿 以 内 的 数字 比较 ， 忽 略 类 型 差异 。 


练习 13.2: 编写 一 个 函数 ， 报 告 其 参数 是 否 循环 数据 结构 。 


13.4. 通过 cgo 调 用 C 代 码 


Go 程序 可 能 会 遇 到 要 访问 C 语 言 的 某 些 硬件 驱动 函数 的 场景 ， 或 者 是 从 一 个 C++ 语言 实现 的 

嵌入 式 数据 库 查询 记录 的 场景 ， 或 者 是 使 用 Fortran 语 言 实现 的 一 些 线性 代数 库 的 场景 。C 语 
言 作为 一 个 通用 语言 ， 很 多 库 会 选择 提供 一 个 C 兼 容 的 AP|， 然 后 用 其 他 不 同 的 编程 语言 实现 
( 译 者 : Go 语言 需要 也 应 该 拥抱 这 些 巨 大 的 代码 遗产 ) © 


在 本 节 中 ， 我 们 将 构建 一 个 简易 的 数据 压缩 程序 ， 使 用 了 一 个 Go 语言 自 带 的 叫 cgo 的 用 于 支 
援 C 语 言 函 数 调用 的 工具 。 这 类 工具 一 般 被 称 为 foreign-function interfaces (简称 仙 ) ,并 且 
在 类 似 工具 中 cgo 也 不 是 唯一 的 。SWIG ( http://swig.org ) 是 另 一 个 类 似 的 且 被 广泛 使 用 的 
工具 ，SWIG 提 供 了 很 多 复杂 特性 以 支援 C++ 的 特性 ， 但 SWIG 并 不 是 我 们 要 讨论 的 主题 。 


在 标准 库 的 compress/... 子 包 有 很 多 流行 的 压缩 算法 的 编码 和 解码 实现 ， 包 括 流行 的 LZW 压 
缩 算 法 (Unix 的 compress 命 令 用 的 算法 ) 和 DEFLATE 压 缩 算法 (GNU gzip 命令 用 的 算 

法 ) 。 这 些 包 的 API 的 细节 虽然 有 些 差异 ， 但 是 它们 都 提供 了 针对 io.Writer 类 型 输出 的 压缩 接 
口 和 提供 了 针对 io.Reader 类 型 输入 的 解压 缩 接口 。 例 如 : 


package gzip // compress/gzip 
func Newwriter(w io.Writer) io.WriteCloser 
func NewReader(r io.Reader) (io.ReadCloser, error) 


bzip2 压 缩 算 法 ， 是 基于 优雅 的 Burrows-Wheeler 变 换算 法 ， 运 行 速度 比 gzip 要 慢 ， 但 是 可 以 

提供 更 高 的 压缩 比 。 标 准 库 的 compress/bzip2 包 目前 还 没有 提供 bzip2 压 缩 算 法 的 实现 。 完 全 
从 头 开 始 实现 是 一 个 压缩 算法 是 一 件 繁琐 的 工作 ， 而 且 http://bzip.org 已 经 有 现成 的 libbzip2 

的 开源 实现 ， 不 仅 文档 齐全 而 且 性 能 又 好 。 


如 果 是 比较 小 的 C 语 言 库 ， 我 们 完全 可 以 用 纯 Go 语 言 重新 实现 一 遍 。 如 果 我 们 对 性 能 也 没有 
特殊 要 求 的 话 ， 我 们 还 可 以 用 os/exec 包 的 方法 将 C 编 写 的 应 用 程序 作为 一 个 子 进程 运行 。 只 
有 当 你 需要 使 用 复杂 而 且 性 能 更 高 的 底层 C 接 口 时 ， 就 是 使 用 cgo 的 场景 了 (译注 : 用 os/exec 
包 调 用 子 进 程 的 方法 会 导致 程序 运行 时 依赖 那个 应 用 程序 ) 。 下 面 我 们 将 通过 一 个 例子 讲述 
cgo 的 具体 用 法 。 


译注 : 本 章 采 用 的 代码 都 是 最 新 的 。 因 为 之 前 已 经 出 版 的 书 中 包含 的 代码 只 能 在 Go1.5 之 前 使 
用 。 从 Go1.6 开 始 ，Go 语 言 已 经 明确 规定 了 哪些 Go 语言 指针 可 以 之 间 传 入 C 语 言 函 数 。 新 代 
码 重 点 是 增加 了 bz2alloc 和 bz2free 的 两 个 防 数 ， 用 于 bz_stream 对 象 空 间 的 申请 和 释放 操作 。 
下 面 是 新 代码 中 增加 的 注释 ， 说 明 这 个 问题 : 


// The version of this program that appeared in the first and second 

// printings did not comply with the proposed rules for passing 

// pointers between Go and C, described here: 

// https://github.com/golang/proposal/blob/master/design/12416-cgo-pointers.md 


// The rules forbid a C function like bz2compress from storing 'in' 
// and 'out' (pointers to variables allocated by Go) into the Go 


// variable 's', even temporarily. 

// The version below, which appears in the third printing, has been 
// corrected. To comply with the rules, the bz_stream variable must 
// be allocated by C code. We have introduced two C functions, 

// bz2alloc and bz2free, to allocate and free instances of the 

// bz_stream type. Also, we have changed bz2compress so that before 
// it returns, it clears the fields of the bz_stream that contain 

// pointers to Go variables. 


要 使 用 libbzip2， 我 们 需要 先 构 建 一 个 bz_stream 结 构 体 ， 用 于 保持 输入 和 输出 缓存 。 然 后 有 
三 个 函数 : BZ2_bzCompresslnit 用 于 初始 化 缓存 ，BZ2_bzCompress 用 于 将 输入 缓存 的 数据 


压缩 到 输出 缓存 ，BZ2_ bzCompressEnd 用 于 释放 不 需要 的 缓存 。 (目前 不 要 担心 包 的 具体 结 


构 , 这 个 例子 的 目的 就 是 演示 各 个 部 分 如 何 组 合 在 一 起 的 。) 


我 们 可 以 在 Go 代码 中 直接 调用 BZ2_bzCompresslnit 和 BZ2 _bzCompressEnd， 但 是 对 于 
BZ2_bzCompress， 我 们 将 定义 一 个 C 语 言 的 包装 函数 ， 用 它 完 成 站 正 的 工作 。 下 面 是 C 代 
码 ， 对 应 一 个 独立 的 文件 。 


gopl.io/ch13/bzip 


7. hiss he gopi 10/chi3s/bz1p/bzap2.c, y 
/* a simple wrapper for libbzip2 suitable for cgo. */ 
#include <bzlib.h> 


int bz2compress(bz_stream *s, int action, 
char *in, unsigned *inlen, char *out, unsigned *outlen) { 

s->next_in = in; 
s->avail_in = *inlen; 
s->next_out = out; 
s->avail_out = *outlen; 
int r = BZ2_bzCompress(s, action); 
*inlen -= s->avail_in; 
*outlen -= s->avail_out; 
s->next_in = s->next_out = NULL; 
(Seite Tee 


现在 让 我 们 转 到 Go 语言 部 
实 并 没有 一 个 叫 C 的 包 ， 但 是 这 行 语 名 会 让 Go 编译 程序 在 编译 之 前 先 运行 cgo 工 具 。 


分 ， 第 一 部 分 如 下 所 示 。 其 中 import "o" 的 语句 是 比较 特别 的 。 其 


// Package bzip provides a writer that uses bzip2 compression (bzip.org). 
package bzip 


/* 
#cgo CFLAGS: -I/usr/include 
#cgo LDFLAGS: -L/usr/lib -1bz2 
#include <bzlib.h> 
#include <stdlib.h> 
bz_stream* bz2alloc() { return calloc(1, sizeof(bz_stream)); } 
int bz2compress(bz_stream *s, int action, 
char *in, unsigned *inlen, char *out, unsigned *outlen); 
void bz2free(bz_stream* s) { free(s); } 
F 
import "Cc" 


import ( 
Who) 
"unsafe" 


type writer struct { 
Ww io.Writer // underlying output stream 
stream *C.bz_stream 
outbuf [64 * 1024]byte 


// NewWriter returns a writer for bzip2-compressed streams. 

func Newwriter(out io.Writer) io.WriteCloser { 
const blockSize = 9 
const verbosity = 0 
const workFactor = 30 
w := &writer{w: out, stream: C.bz2alloc()} 
C.BZ2_bzCompressInit(w.stream, blockSize, verbosity, workFactor) 
return w 


在 预 处 理 过 程 中 ，cgo 工 具 为 生成 一 个 临时 包 用 于 包含 所 有 在 Go 语言 中 访问 的 C 语 言 的 函数 或 
类 型 。 例 如 C.bz_stream 和 C.BZ2_bzCompresslnit。cgo 工 具 通 过 以 某 种 特殊 的 方式 调用 本 地 
的 C 编 译 器 来 发 现在 Go 源 文件 导入 声明 前 的 注释 中 包含 的 C 头 文件 中 的 内 容 (译注 : import 
non 语句 前 仅 挨 着 的 注释 是 对 应 cg9 的 特殊 语法 ， 对 应 必要 的 构建 参数 选项 和 Ci 语言 代码 ) 。 


在 cgo 注 释 中 还 可 以 包含 #cgo 指 令 ， 用 于 给 C 语 言 工具 链 指定 特殊 的 参数 。 例 如 CFLAGS 和 
LDFLAGS 分 别 对 应 传 给 C 语 言 编 译 器 的 编译 参数 和 链接 器 参数 ， 使 它们 可 以 特定 目录 找到 
bzlib.h 头 文件 和 libbz2.a 库 文件 。 这 个 例子 假设 你 已 经 在 /usr 目 录 成 功 安装 了 bzip2 库 。 如 果 
bzip2 库 是 安装 在 不 同 的 位 置 ， 你 需要 更 新 这 些 参 数 (译注 : 这 里 有 一 个 从 纯 C 代 码 生 成 的 cgo 
绑 定 ， 不 依赖 bzip2 静 态 库 和 操作 系统 的 具体 环境 ， 具 体 请 访问 
https://github.com/chai2010/bzip2 ) 。 
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writer 结 构 中 还 包括 了 另 一 个 buffer， 用 于 输出 缓存 。 


下 面 是 Write 方法 的 实现 ， 返 回 成 功 压缩 数据 的 大 小 ， 主 体 是 一 个 循环 中 调用 C 语 言 的 
bz2compress 亏 数 实现 的 。 从 代码 可 以 看 到 ，Go 程 序 可 以 访问 Ci 语言 的 bz_stream、char 和 
Uint 类 型 ， 还 可 以 访问 bz2compress 等 函数 ， 甚 至 可 以 访问 C 语 言 中 像 BZ_RUN 那 样 的 宏 定 
义 ， 全 部 都 是 以 C.x 语 法 访问 。 其 中 C.uint 类 型 和 Go 语言 的 uint 类 型 并 不 相同 ， 即 使 它们 具有 
相同 的 大 小 也 是 不 同 的 类 型 。 


func (w *writer) Write(data []byte) (int, error) { 
if w.stream == nil { 
panic("closed") 


} 


var total int // uncompressed bytes written 


for len(data) > © { 
inlen, outlen := C.uint(len(data)), C.uint(cap(w.outbuf) ) 
C.bz2compress(w.stream, C.BZ_RUN, 
(*C.char)(unsafe.Pointer(&data[0])), &inlen, 
(*C.char)(unsafe.Pointer(&w.outbuf)), &outlen) 
total += int(inlen) 
data = data[inlen: ] 
if _, err := w.w.Write(w.outbuf[:outlen]); err != nil { 
return total, err 
} 
} 


return total, nil 


在 循环 的 每 次 迭代 中 ， 向 bz2compress 传 入 数据 的 地 址 和 剩余 部 分 的 长 度 ， 还 有 输出 缓存 
WwW.outbuf 的 地 址 和 容量 。 这 两 个 长 度 信息 通过 它们 的 地 址 传 入 而 不 是 值 传 入 ， 因 为 
bz2compress 有 函数 可 能 会 根据 已 经 压缩 的 数据 和 压缩 后 数据 的 大 小 来 更 新 这 两 个 值 。 每 个 块 
压缩 后 的 数据 被 写 入 到 底层 的 io.Writer。 


Close 方 法 和 Write 方法 有 着 类 似 的 结构 ， 通 过 一 个 循环 将 剩余 的 压缩 数据 刷新 到 输出 缓存 。 


// Close flushes the compressed data and closes the stream. 
// It does not close the underlying io.Writer. 
func (w *writer) Close() error { 
if w.stream == nil { 
panic("closed") 
} 
defer func() { 
C.BZ2_bzCompressEnd(w.stream) 
C.bz2free(w.stream) 
w.stream = nil 
}() 
for { 
inlen, outlen := C.uint(9), C.uint(cap(w.outbuf) ) 
r := C.bz2compress(w.stream, C.BZ_FINISH, nil, &inlen, 
(*C.char)(unsafe.Pointer(&w.outbuf)), &outlen) 
if _, err := w.w.Write(w.outbuf[:outlen]); err != nil { 
return err 
} 
if r == C.BZ_STREAM_END { 
return nal 


压缩 完成 后 ，Close 方 法 用 了 defer 函 数 确 保函 数 退 出 前 调用 C.BZ2_bzCompressEnd 和 
C.bz2free 释 放 相 关 的 C 语 言 运行 时 资源 。 此 刻 w.stream 指 针 将 不 再 有 效 ， 我 们 将 它 设置 为 nil 
以 保证 安全 ， 然 后 在 每 个 方法 中 增加 了 nil 检 测 ， 以 防止 用 户 在 关闭 后 依然 错误 使 用 相关 方 


法 。 


上 面 的 实现 中 ， 不 仅仅 写 是 非 并 发 安全 的 ， 甚 至 并 发 调用 Close 和 Write 方法 也 可 能 导致 程序 的 


的 崩溃 。 修 复 这 个 问题 是 练习 13.3 的 内 容 。 


下 面 的 bzipper 程 序 ， 使 用 我 们 自己 包 实 现 的 bzip2 压 缩 命 令 。 它 的 行为 和 许多 Unix 系 统 的 


bzip2 命 令 类 似 。 


gopl.io/ch13/bzipper 


// Bzipper reads input, bzip2-compresses it, and writes it out. 
package main 


import ( 
Nao" 
"log" 
Nos" 
"gopl.io/chi3/bzip" 
) 


func main() { 
w := bzip.Newwriter(os.Stdout) 


if _, err := i0.Copy(w, os.Stdin); err != nil { 
log.Fatalf("bzipper: %v\n", err) 

} 

if err := w.Close(); err != nil { 
log.Fatalf("bzipper: close: %v\n", err) 

} 


在 上 面 的 场景 中 ， 我 们 使 用 bzipper 压 缩 了 /usrshare/dict/words 系 统 自 带 的 词典 ， 从 938,848 
字 节 压缩 到 335,405 字 节 。 大 约 是 原始 数据 大 小 的 三 分 之 一 。 然 后 使 用 系统 自 带 的 bunzip2 命 


令 进行 解压 。 压 缩 前 后 文件 的 SHA256 哈 希 码 是 相同 了 ， 这 也 说 明了 我 们 的 压缩 工具 是 正确 
的 。 (如 果 你 的 系统 没有 sha256sum 命 令 ， 那 么 请 先 按 照 练 习 4.2 实 现 一 个 类 似 的 工具 ) 


$ go build gopl.io/chi3/bzipper 

$ we -c < /usr/share/dict/words 

938848 

$ sha256sum < /usr/share/dict/words 
126a4ef38493313edc50b86f90dfdaf7c59ec6c948451eac228f2F3a8abilabed - 
$ ./bzipper < /usr/share/dict/words | wc -c 

335405 

$ ./bzipper < /usr/share/dict/words | bunzip2 | sha256sum 
126a4ef38493313edc50b86f90dfdaf7c59ec6c948451eac228f2F3a8abiabed - 


我 们 演示 了 如 何 将 一 个 C 语 言 库 链接 到 Go 语言 程序 。 相 反 , 将 Go 编译 为 静态 库 然后 链接 到 C 程 
序 ， 或 者 将 Go 程序 编译 为 动态 库 然 后 在 C 程 序 中 动态 加 载 也 都 是 可 行 的 (译注 : 在 Go1.5 中 ， 
Windows 系 统 的 Go 语言 实现 并 不 支持 生成 C 语 言 动 态 库 或 静态 库 的 特性 。 不 过 好 消息 是 ， 目 
前 已 经 有 人 在 尝试 解决 这 个 问题 ， 具 体 请 访问 |lssue11058 ) 。 这 里 我 们 只 展示 的 cgo 很 小 的 
一 些 方面 ， 更 多 的 关于 内 存 管 理 、 指 针 、 回 调 函 数 、 中 断 信 号 处 理 、 字 符 串 、errno 处 理 、 终 
结 器 ， 以 及 goroutines 和 系统 线程 的 关系 等 ， 有 很 多 细节 可 以 讨论 。 特 别 是 如 何 将 Go 语言 的 
指针 传 入 C 函 数 的 规则 也 是 异常 复杂 的 (译注 : 简单 来 说 ， 要 传 入 C 函 数 的 Go 指针 指向 的 数据 
本 身 不 能 包含 指针 或 其 他 引用 类 型 ; 并 且 C 函 数 在 返回 后 不 能 继续 持 有 Go 指针 ; 并 且 在 C 函 数 
返回 之 前 ，Go 指 针 是 被 锁定 的 ， 不 能 导致 对 应 指针 数据 被 移动 或 栈 的 调整 ) ， 部 分 的 原因 在 
13.2 节 有 讨论 到 ， 但 是 在 Go1.5 中 还 没有 被 明确 (译注 : Go1.6 将 会 明确 cgo 中 的 指针 使 用 规 
则 ) 。 如 果 要 进一步 阅读 ， 可 以 从 https://golang.org/cmd/cgo 开始 。 


练习 13.3 : 使 用 sync.Mutex 以 保证 bzip2.writer 在 多 个 goroutines 中 被 并 发 调用 是 安全 的 。 


% 213.4: 因为 C 库 依赖 的 限制 。 使 用 os/exec 包 启动 /bin/bzip2 命 令 作 为 一 个 子 进 程 ， 提 供 
一 个 纯 Go 的 bzip.NewWriter 的 替代 实现 〈 译 注 : 虽然 是 纯 Go 实 现 ， 但 是 运行 时 将 依 
赖 /bin/bzip2 命 令 ， 其 他 操作 系统 可 能 无 法 运行 ) 。 


13.5. JL aa 忠告 


我 们 在 前 一 章 结尾 的 时 候 ， 我 们 警告 要 谨 懂 使 用 reflect 包 。 那 些 警 告 同样 适用 于 本 章 的 unsafe 
名 。 


高 级 语言 使 得 程序 员 不 用 在 关心 真正 运行 程序 的 指令 细节 ， 同 时 也 不 再 需要 关注 许多 如 内 存 
布局 之 类 的 实现 细节 。 因 为 高 级 语言 这 个 绝缘 的 抽象 层 ， 我 们 可 以 编写 安全 健壮 的 ， 并 且 可 
义 运 行 在 不 同 操作 系统 上 的 具有 高 度 可 移植 性 的 程序 。 


但 是 unsafe 包 ， 它 让 程序 员 可 以 透 过 这 个 绝缘 的 抽象 层 直 接 使 用 一 些 必 要 的 功能 ， 虽 然 可 能 
是 为 了 获得 更 好 的 性 能 。 但 是 代价 就 是 牺牲 了 可 移植 性 和 程序 安全 ， 因 此 使 用 unsafe 包 是 一 
个 危险 的 行为 。 我 们 对 何 时 以 及 如 何 使 用 unsafe 包 的 建议 和 我 们 在 11.5 节 提 到 的 Knuth 对 过 蛙 
优化 的 建议 类 似 。 大 多 数 Go 程 序 员 可 能 永远 不 会 需要 直接 使 用 unsafe 包 。 当 然 ， 也 永远 都 会 
有 一 些 需要 使 用 unsafe 包 实现 会 更 简单 的 场景 。 如 果 确实 认为 使 用 unsafe 包 是 最 理想 的 方 
式 ， 那 么 应 该 尽 可 能 将 它 限制 在 较 小 的 范围 ， 那 样 其 它 代码 就 忽略 unsafe 的 影响 。 


=) 


现在 ， 赶 紧 将 最 后 两 章 抛 入 脑 后 吧 。 编 写 一 些 实 实在 在 的 应 用 是 丨 理 。 请 远离 reflect 的 unsafe 
， 除非 你 确实 需要 它们 。 


(Gy 


后 ， 用 Go 快乐 地 编程 。 我 们 希望 你 能 像 我 们 一 样 喜欢 Go 语言 。 


ie 


HY aK 


英文 原版 并 没有 包含 附录 部 分 ， 只 有 一 个 索引 部 分 。 中 文 版 增加 附录 部 分 主要 用 于 收录 一 些 
和 本 书 相 关 的 内 容 ， 比 如 美文 原版 的 勘误 (有些 读 者 可 能 会 对 照 中 文 和 美文 原 阅 读 ) + RX 
作者 和 中 文 译 者 、 译 文 授 权 等 内 容 。 以 后 还 可 能 会 考虑 增加 一 些 习 题解 答 相 关 的 内 容 。 


需要 特别 说 明 的 是 ， 中 文 版 附录 并 没有 包含 英文 原版 的 索引 信息 。 因 为 英文 原版 的 索引 信息 
主要 是 记录 每 个 索引 所 在 的 英文 页 面 位 置 ， 而 中 文 版 是 以 GitBook 方 式 组 织 的 html 网 页 形式 ， 
将 英文 页 面 位 置 转 为 章节 位 置 可 能 会 更 合理 ， 不 过 这 个 会 涉及 到 繁琐 的 手工 操作 。 如 果 大 家 
有 更 好 的 建议 ， 请 告知 我 们 。 


附录 A : 原文 勘误 


p.9, 12: for "can compared", read "can be compared". (Thanks to Antonio Macias Ojeda, 
2015-10-22. Corrected in the second printing.) 


p.13: As printed, the gopl.io/ch1/lissajous program is deterministic, not random. We've 
added the statement below to the downloadable program so that it prints a pseudo-random 
image each time it is run. (Thanks to Randall McPherson, 2015-10-19.) 


rand.Seed(time.Now().UTC() .UnixNano() ) 


p.15, 2: For "inner loop", read "outer loop". (Thanks to Ralph Corderoy, 2015-11-28. 
Corrected in the third printing.) 


p.19, 12: For "Go's libraries makes", read "Go's library makes". (Thanks to Victor Farazdagi, 
2015-11-30. Corrected in the third printing.) 


p.40, 94: For "value of the underlying type", read "value of an unnamed type with the same 
underlying type". (Thanks to Carlos Romero Brox, 2015-12-19.) 


p.40, 11: The paragraph should end with a period, not a comma. (Thanks to Victor 
Farazdagi, 2015-11-30. Corrected in the third printing.) 


p.43, 73: Import declarations are explained in §10.4, not §10.3. (Thanks to Peter Jurgensen, 
2015-11-21. Corrected in the third printing.) 


p.48: f.ReadByte() serves as an example of a reference to f, but *os.File has no such 
method. For "ReadByte", read "Stat", four times. (Thanks to Peter Olsen, 2016-01-06. 
Corrected in the third printing.) 


p.52, M2: for "an synonym", read "a synonym", twice. (Corrected in the second printing.) 


p.52, 79: for "The integer arithmetic operators", read "The arithmetic operators". (Thanks to 
Yoshiki Shibata, 2015-12-20.) 


p.68: the table of UTF-8 encodings is missing a bit from each first byte. The corrected table 
is shown below. (Thanks to Akshay Kumar, 2015-11-02. Corrected in the second printing.) 


OXXXXXXX runes 0-127 (ASCIT) 
110XXXXX 10XXXXXX 128-2047 (values <128 unused) 
1110xxxx 10XXXXXX 10XXXXXX 2048-65535 (values <2048 unused) 


11110xxx 10XXXXXX 10xxxxxx 10xxxxxx 65536-0x10ffff (other values unused) 


p.73, 11: For "a exercise", read "an exercise". (Thanks to vrajmohan, 2015-12-28.) 


p.74: the commentin gopl.io/ch3/printints should say fmt.Sprint , not fmt.Sprintf . 
(Corrected in the second printing.) 


p.75, 14: for "Yu", read "%0". (Thanks to William Hannish, 2015-12-21.) 


p.76: the comment // "time.Duration 5mos should have a closing double-quotation mark. 
(Corrected in the second printing.) 


p.79, 14: "When an untyped constant is assigned to a variable, as in the first statement 
below, or appears on the right-hand side of a variable declaration with an explicit type, as in 
the other three statements, ..." has it backwards: the first statement is a declaration; the 
other three are assignments. (Thanks to Yoshiki Shibata, 2015-11-09. Corrected in the third 


printing.) 


p.112: Exercise 4.11 calls for a "CRUD" (create, read, update, delete) tool for GitHub Issues. 
Since GitHub does not currently allow Issues to be deleted, for "delete", read "close". 
(Thanks to Yoshiki Shibata, 2016-01-18.) 


p.115: The anchor element in gopl.io/ch4/issueshtml 's template is missing a closing </a> 
tag. (Thanks to Taj Khattra, 2016-01-19.) 


p.132, code display following 3: the final comment should read: // compile error: can't 
assign func(int, int) int to func(int) int (Thanks to Toni Suter, 2015-11-21. Corrected in 
the third printing.) 


p.160, 74: For Get("item")) , read Get("item") . (Thanks to Yoshiki Shibata, 2016-02-01.) 
p.166, 12: for "way", read "a way". (Corrected in the third printing.) 


p.200, TestEval function: the format string in the final call to t.Errorf should format test.env 
with %v, not %s. (Thanks to Mitsuteru Sawa, 2015-12-07. Corrected in the third printing.) 


p.222, Exercise 8.1: The port numbers for London and Tokyo should be swapped in the 
final command to match the earlier commands. (Thanks to Kiyoshi Kamishima, 2016-01-08.) 


p.272, 13: for "the request body", read "the response body". (Thanks to 曹 春晖 , 2016-01- 
19.) 


p.288, code display following 4: In the import declaration, for "database/mysql" , read 
"database/sql" . (Thanks to Jose Colon Rodriguez, 2016-01-09.) 


p.347, Exercise 12.8: for "like json.Marshal", read "like json.Unmarshal". (Thanks to 
chai2010, 2016-01-01.) 


p.362: the gopl.io/ch13/bzip program does not comply with the proposed rules for passing 
pointers between Go and C code because the C function bz2compress temporarily stores a 
Go pointer (in) into the Go heap (the bz_stream variable). The bz_stream variable should 


be allocated, and explicitly freed after the call to Bz2_bzcompressEnd , by C functions. (Thanks 
to Joe Tsai, 2015-11-18. Corrected in the third printing.) 
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